
微软开发新一代生成式AI模型:Muse
关于Muse:微软的革新尝试
微软宣布其研究团队开发了一款全新的生成式AI模型,可以生成复杂的游戏操作序列。这款名为World and Human Action Model(简称WHAM)的模型,也被昵称为Muse,旨在支持游戏视觉、控制器动作,甚至两者同时生成。
Muse的技术特色
目前,Muse模型在由忍者理论开发的游戏《血腥边缘》(Bleeding Edge)提供的数据训练下,能够生成分辨率为300 x 180像素的视觉内容。模型训练经历了超过一百万次更新,才最终实现稳定输出、表现出正确的游戏行为与机制。
数据来源与训练规模
微软表示,Muse的训练数据来自超过10亿张图像和数千万次控制器操作,这些数据相当于超过七年的连续人工游戏体验,全部“道德”收集自忍者理论的多人对战游戏《血腥边缘》。
此前,微软曾利用这些玩家数据进行类人导航实验,但在2022年开始设想如果将这些数据输入到机器学习模型中会产生怎样的效果,于是便诞生了Muse这一创新技术。
技术开发背后的挑战
微软透露,起步阶段面临的主要难题是模型训练的规模扩展。团队最初使用V100集群,成功证明了在最多100个GPU上进行训练的可行性,随后逐步扩展至H100 GPU,实现了模型的大规模训练和优化。
设计方面,团队借鉴了大型语言模型(LLM)的经验,特别在有效表达控制动作和图像内容方面做出了关键决策。
Muse的意义与未来应用
技术里程碑:支持创新创作
微软将Muse的研发和发布视为一个“里程碑”,突显生成式AI模型在支持人类创意方面的潜力。演示中,Muse能够处理不同的视觉提示,生成具有新角色的游戏片段,展示了模型在快速生成游戏内容方面的巨大潜能。
创意的未来:未来可能性
Xbox负责人Phil Spencer在视频博客中表示,开发这款模型的目标是利用“科学与艺术的结合”,让创作者实现“前所未有”的创新。目前,“未定义的”新用途尚未可知,但未来或许会在游戏设计、内容重制,甚至游戏保存方面发挥作用。
常见问答(FAQ)
Q: Muse可以独立创建完整的游戏吗?
Q: 未来Muse会用在什么具体场景中?
总之,微软的Muse代表着生成式AI在游戏行业的突破性探索。尽管目前还处于早期阶段,未来的潜力令人期待,或许会极大改变我们设计和体验电子游戏的方式。
游戏技术与AI的未来:探索新可能性
在最近的行业讨论中,专家指出,利用AI模型可以学习旧游戏的玩法,并将其转移到任何支持该模型运行的平台上。这一技术突破意味着,开发者无需依赖原始引擎和硬件环境,即可复刻和移植经典游戏,为玩家带来更多便捷与可能性。

模型学习与平台移植的新机遇
“通过这些模型,系统不仅可以分析游戏的玩法数据和视频,还能学习到其中的核心机制,从而在不同平台上再现游戏体验,”相关专家表示。“这为游戏的数字化保存与移植提供了极大的便利,也为未来的游戏开发带来了全新的思路。”
Ninja Theory的AI创新应用
Ninja Theory工作室负责人Dom Matthews详细说明了他们对AI技术的探索方向。他强调,团队希望利用AI帮助实现“创意的突破”。

推动创意与效率的革新
“这种技术对于我们工作室来说,并不是用来直接生成内容,而是帮助团队优化工作流程,加快创意迭代,将想法更快变为现实。”他补充道:“虽然我们目前还未在游戏开发中使用这项技术,但这为我们如何利用新技术提升工作效率提供了新的思路。”
He further指出,技术的最大价值在于让创意团队专注于人类独有的创造力,而不是繁琐的制作流程。
行业变革背后的挑战
当然,微软在2024年裁员了大约2,550名游戏开发者,这也引发了外界关于行业人才流失的讨论。然而,技术创新仍然在持续推动游戏产业的变革。
关于Muse的更多信息
感兴趣的用户可以访问微软研究院网站,了解更多关于Muse项目的资料,并查看示例输出。

常见问答(FAQ)
Q: AI模型学习旧游戏会带来哪些实际应用?
A: AI模型可以帮助实现游戏的快速移植、数字化保存,以及复刻经典游戏,为开发者节省时间和成本,同时让玩家可以在多平台体验到经典作品。
Q: Ninja Theory为什么重视AI在创意流程中的作用?
A: 团队希望利用AI提升工作效率和创意产出,让设计师能更专注于创新和故事,减少繁琐的制作流程,从而带来更高质量和更具想象力的游戏作品。