谷歌DeepMind的团队推出了Genie 3——一种用于生成互动虚拟世界的新型神经网络。该模型允许您根据文本提示构建环境,并像简单的视频游戏一样实时探索它们。
Genie 3的主要升级是其能够更长时间保持世界稳定性。虽然其前身(Genie 2)最多只能进行约20秒的互动,但用户现在可以在没有严重扭曲的情况下探索虚拟空间几分钟。该系统已经学会了“记住”暂时离开相机视野的物体。
该神经网络以720p分辨率和24帧每秒生成世界。它支持复杂场景,包括天气效果、水物理、动态照明以及拥有植物和动物的生态系统。生成的世界风格可以从照片真实的地点到动画和幻想设置不等。
它是如何工作的:用户输入文本提示(例如,“从船上探索威尼斯运河”或“飞越火山”)。Genie 3生成环境,您可以使用键盘进行导航。一个新的“提示事件”功能允许在探索过程中对世界进行调整——召唤雨水、添加角色或通过新的文本命令改变地形。
这项技术不仅被视为娱乐工具。它还准备在模拟环境中训练AI代理、教育项目或原型游戏关卡。目前,Genie 3标志着在创建“稳定”的AI生成世界方面取得了重大进展,提供了比以前的模型更少碎片化的用户体验。
帖子已翻译 显示原文 (EN)