关于OpenAI正在开发自己的流行视频服务的传言就在昨天在网上流传 ,而今天,这些猜测得到了证实。该公司不仅推出了新的Sora 2视频模型,还推出了一款独立的iOS应用程序,该应用程序被定位为一个用于协作创作的社交平台。
新的神经网络不仅仅是关于更高质量的画面;它展示了对场景中物理世界更深刻的理解。在之前,一个错失投篮的篮球运动员可能会看到篮球神奇地穿过篮筐,而Sora 2则允许篮球真实地从篮板反弹。开发者指出,该模型现在不仅可以模拟成功的动作,还可以模拟失败,使得视频更加逼真。
另一个重要的升级是可控性。用户现在可以给系统复杂的多步骤指令——例如,在单个剪辑中请求多个镜头变化——而模型保持场景和画面中所有物体的一致性。然而,最受关注的功能是将自己写入视频的能力。“Cameo”技术在对一个人的外貌和声音进行短暂扫描后,允许你将自己的数字副本——甚至是你的宠物——添加到任何生成的故事情节中。正是这种能力构成了新的iPhone Sora应用程序的基础。
该应用程序本身并不是一个供被动消费的无尽内容源,如之前所假设的,而是一个用于协作创作的工具。用户可以创建视频,重新混合彼此的作品,并在共享项目中使用他们的“Cameos”。对于青少年,该应用程序将设有每日滚动时间限制和增强的家长控制功能。
目前,Sora 2模型和应用程序的访问仅限于美国和加拿大的居民,需通过邀请才能使用。在正式发布后,基础版本将是免费的,但请求次数有限,而ChatGPT Pro订阅者将获得更高级的Sora 2 Pro模型的访问权限。尚未公布全球推广的时间表或该应用程序在其他平台(如Android)上的可用性。
帖子已翻译 显示原文 (EN)