最近,谷歌DeepMind推出了Genie的新版本——一个实时虚拟世界生成模型,能够创建完全互动的3D环境。用户可以通过文本提示在虚拟世界中移动并与之互动——而且可以持续几分钟,这比Genie 2要长得多。关键创新在于该模型能够记住场景中的物体和变化,大大增强了模拟的真实感。新的神经网络版本仍然是一项实验性技术,仅对选定的测试者开放。然而,Genie 3已经让我们对未来10到20年内游戏可能的发展有了一个清晰的概念——甚至可能更早。
Genie 3的功能
谷歌的神经网络属于所谓的“世界模型”类别——能够利用对世界的理解来进行模拟的AI系统。Genie 3可以预测各种动作将如何影响虚拟环境,并实时实施这些变化。
与之前的版本不同,新版Genie以720p而不是360p渲染模拟;交互窗口持续几分钟,而不是10到20秒;模型对命令的响应是即时的——这是不久前不可能实现的。
Genie 3可以真实地模拟光照、反射和世界的其他物理属性——例如水的模拟。令人印象深刻的是,神经网络可以生成完整的生态系统,里面有栩栩如生的动物和植物。
而且,真实感并不是它唯一的强项:AI模型还可以生成卡通风格的环境,里面有风格化的幻想生物——例如纸蜥蜴或类似宝可梦的生物。
但Genie 3最大的进步在于它的记忆。该模型现在可以记住用户对模拟所做的更改。例如,用户可能会改变天气,添加新物体或角色,然后离开场景,稍后再回来——一切都会保持在他们离开时的状态。当然,随着时间的推移,错误开始积累,但如前所述,系统在几分钟内保持稳定——这是一个显著的改进。
Would you like to play a game where the story and world are created by AI in real time?
当前的局限性
Genie 3可以根据文本提示改变虚拟世界。例如,如果你输入“添加一棵树”,模型会做出响应并进行更改。然而,在这个阶段,用户控制的游戏角色——即所谓的代理——只能走路、跳跃和执行基本动作。你不能直接让他们种树。更复杂的动作——例如改变天气——是通过文本命令“魔法般”触发的。
谷歌的研究人员仍在努力解决如何将多个代理集成到模拟中的问题。建模多个可控角色之间的互动仍然是一个过于复杂的挑战。
目前,Genie 3也无法准确重现现实世界的位置,并且在渲染文本方面存在困难。
最后,Genie 3的创作者们正在继续努力改善系统的稳定性,以便模拟不仅可以“活”几分钟,而是可以持续数小时。尽管这个版本相比之前的版本有了巨大的飞跃,但交互窗口的持续时间仍然是关键限制。
这些是DeepMind自己的工程师所承认的局限性。然而,如果你仔细 检查谷歌发布的演示,你会注意到Genie 3的其他缺陷。例如,在飓风模拟中完全静止的棕榈树,或在白天场景中水面渲染不佳。在滑雪演示中,雪的物理行为并不总是看起来真实。此外,几乎每个视频都包含小的视觉伪影或不一致之处。当然,我们也不能忽视Genie 3仍然无法生成音频这一事实——这对沉浸感产生了负面影响。
这对未来游戏意味着什么?
实际上,过于关注Genie 3的缺陷是有些无谓的:在六个月到一年内,许多缺陷可能不再相关——神经网络的进化速度如此之快。就在几年前,人们还在嘲笑一段生成的视频,内容是 威尔·史密斯吃意大利面,而今天,社交媒体上许多人将一段关于袋鼠 被拒绝登机的商业航班视频,认为是用Veo 3制作的真实视频。
重要的是,Genie 3已经为开发者提供了对未来虚拟冒险构建工具的洞察。谷歌正在研发的技术属于神经游戏引擎的概念——一种新型引擎,其中许多功能,如关卡生成、物理模拟、NPC行为,甚至图形,都由AI处理,而不是传统代码。开发者可以无需手动操作就能为角色动画,而玩家可以体验到真正非线性的RPG叙事,游戏会动态适应他们的行为。
然而,更可能的是,神经游戏引擎不会完全取代传统引擎,而是会融入其中——作为Unity或Unreal等平台的一部分。至少在最初。随着时间的推移,它们可能会演变为独立的开发工具。
如今,像Genie 3这样的技术尚未达到可以在其上构建完整游戏的水平。尽管如此,纽约大学Tandon工程学院的计算机科学与工程副教授Julian Togelius认为,Genie 3已经可以为开发者提供帮助。他测试了该模型,并在个人博客上 写道:
我认为Genie 3的可行用例现在就是构思。确实,该模型在一些大致符合分布的事物上表现最佳(例如“在格林威治村驾驶法拉利”),但这些也是最不有趣的结果,如果人们可以玩一款好游戏,他们不会想玩这些。另一方面,像“Tetris #reallife #photorealistic”这样的奇特提示则产生了非常有趣和引人入胜的结果,完全实现了可以探测以揭示新可能性的互动梦境。该模型成为一个思维工具,可以帮助专业或业余设计师提出新的场景、机制和资产,然后可以在游戏引擎中重建。
Genie的某个未来版本也可能成为原型工具。设计师可以详细描述他们的想法,并在短时间内拥有一个可玩的描述游戏场景的粗糙版本。
***
神经游戏引擎完全有可能正是解决当前AAA游戏开发危机所需的。创建昂贵的虚拟冒险变得越来越不可持续:预算膨胀到数亿美元,主要游戏现在平均需要超过六年才能发布。而且情况只会变得更糟。如果没有任何变化,那么 GTA 7,例如,可能要到2040年代才能发布。像Genie 3这样的AI模型可以通过减少技术劳动的量来帮助减轻开发者的工作负担。
你怎么看?谷歌的工作让你印象深刻吗?在评论中分享你的想法。
How do you feel about the rise of neural game engines?