谷歌推出 Genie 2:强大的AI环境生成工具

谷歌AI工具Genie 2界面截图

谷歌的人工智能工具Genie 2是一款“规模庞大的基础世界模型”,它能够通过单一图片提示生成“无限多样的可控动作、可玩3D环境”。

多角度场景与互动物体

Genie 2可以创建不同的视角,包括第一人称视角、等距视图或第三人称驾驶视频,以及“复杂的3D视觉场景”,场景中包含互动物体,如门和爆炸桶。

物理效果与快速原型

该工具可以快速模拟烟雾、重力、光照和反射等物理效果,用户或“AI代理人”可通过键盘和鼠标进行操作与测试。据报道,这大大提升了艺术家和设计师的原型开发速度,有助于快速开启环境设计的创意流程,并进一步加速研究进展。

从概念到互动环境

“得益于Genie 2的泛化能力,概念艺术和绘画可以转变为完全互动的虚拟环境,”报道称,“这使得艺术家和设计师可以迅速进行原型开发,推动环境设计创新,助力研究提速。”

未来发展与突破

“虽然这项研究仍处于早期阶段,在代理人和环境生成方面仍有很大的提升空间,但我们相信Genie 2为解决训练实体代理人的结构性问题开辟了路径,同时实现了向通用人工智能(AGI)迈进所需的宽度和通用性。”

更多信息

完整的报告及示例可在谷歌DeepMind子站点获取。

最新合作动态

今日早些时候,英国专业媒体出版商Future宣布与OpenAI达成战略合作,将在其销售、市场和编辑业务中全面使用ChatGPT工具。

常见问答(FAQ)

Q: Genie 2的主要应用场景有哪些?

A: 它主要用于快速生成复杂的3D虚拟环境、提供多角度视图,以及模拟物理效果,帮助游戏开发虚拟现实以及设计行业提高效率和创新能力。

Q: Genie 2的技术能否支持真实时间互动?

A: 是的,Genie 2能快速模拟环境中的物理效果和交互,支持人类用户或AI代理实时操作,极大增强了虚拟环境的交互性和实用性。