谷歌‘精灵’计划震撼发布：AI开启‘凭空造世’新纪元

新浪财经2026-02-01更新于 2026-02-013.6万阅读

谷歌DeepMind开放Project Genie世界模型，可将文字转化为交互式虚拟世界，标志着AI进入‘凭空造世’时代。该技术为机器人、动画制作等领域提供新工具，助力AI理解物理规则与因果逻辑。尽管当前版本存在生成时间限制和物理效果不足等问题，但已引发李飞飞、杨立昆等AI大牛及科技巨头的广泛关注。

谷歌‘精灵’计划震撼发布：AI开启‘凭空造世’新纪元

共2463字 AI帮我划重点

谷歌DeepMind于1月30日首次开放世界模型Project Genie，该模型能将文字描述转化为可交互的虚拟世界，被称为‘凭空造世’的里程碑。
Project Genie基于Genie3世界模型，突破传统生成模型局限，可模拟环境动态变化，为AI提供‘模拟训练场’。
该技术为机器人、动画制作等领域提供新工具，助力AI理解现实世界的物理规则与因果逻辑，迈向通用人工智能。
世界模型获学术界与科技巨头关注，李飞、杨立昆等AI领域顶尖人物纷纷布局，相关初创公司估值已达数十亿美元。
游戏与影视行业或率先受益，Project Genie可大幅缩短3D资产创建与场景搭建时间，重塑创作流程。
当前版本仍存限制，如生成时间受限、物理效果不够逼真，需依赖专用计算芯片支持。

内容由松鼠AI生成，仅供参考

《科创板日报》1月31日讯（编辑宋子乔）如果人工智能领域的进步可以看作一部交响乐，那么过去几年，乐章的主题无疑是‘生成’——生成文字、图像、声音乃至视频。然而，在2026年初，一段崭新的旋律被奏响：它不仅生成，更能构建。

北京时间1月30日凌晨，谷歌DeepMind向外部开放了Project Genie，它被认为是目前最先进的世界模型之一，可以算是世界模型Genie3的实验性研究原型，也是这套世界模型第一次以可交互形态对公众开放。

‘Genie’这个单词源于阿拉伯语jinni（精灵），后经法语变形成génie后成为一个英语词汇，最常见的含义是指阿拉伯和伊斯兰神话传说中，一个能实现召唤者愿望的‘精灵’或‘神怪’。谷歌DeepMind将其世界模型项目命名为‘Project Genie’（精灵计划），正是在阐释该神话的内涵：这个AI模型能将你用文字描述的任何场景（召唤者的愿望），瞬间生成一个可以进入并交互的虚拟世界。

当AI不仅能够描绘梦境，更能让人走进梦境并与之互动时，我们所讨论的‘虚拟’与‘现实’的边界，或许已到了需要被重新思考的时刻。

目前，该原型率先向年满18岁的美国Google AI Ultra（3个月125美元）订阅用户开放。

Project Genie有何不同？

Project Genie的底层是世界模型Genie3。与OpenAI的Sora等内容生成大模型不同，它的功能不局限于多模态内容生成（比如AI视频生成工具可为用户创作一段影片，模型可依据、参考的一切数据来自人类储存好的文字库、图像库及视频库），而是可以生成一个完整的空间，实现‘凭空造世’：

从技术本质上看，世界模型的核心是模拟环境的动态变化，预测环境的演化和行为对环境的影响。

谷歌DeepMind在诸如国际象棋、围棋等特定环境的AI智能体研发上已有深厚积累，但要实现通用人工智能（AGI），系统必须能够理解和应对现实世界近乎无限的复杂性与多样性。

Genie3正是在这一方向上迈出的关键一步。它提供了一种前所未有的模拟能力，能够生成任何现实或虚构场景的交互式环境。这为机器人技术、动画制作乃至历史场景的虚拟探索等领域提供了强大的工具。

对于AI的发展而言，Project Genie的深意远不止于炫酷的体验。它最核心的价值，在于为AI智能体（及未来的机器人）提供了一个无限、安全且成本可控的‘模拟训练场’、‘试错沙盒’。智能体可以在Genie创造的海量、多样化的模拟环境中进行学习和训练，理解现实世界的物理规则和因果逻辑，这正是迈向通用人工智能不可或缺的基石。

从这个角度看，世界模型并非一个内容端的创作工具，而是一座连接当前AI与未来‘具身智能’的桥梁，是让AI学会‘常识’与‘因果’的关键基础设施。

AI学术大佬、科技巨头争相布局

人工智能先驱们几乎一致认为，世界模型对打造下一代人工智能至关重要。许多人表示，该技术终将助力创造超越人类的AGI。

斯坦福大学教授、人工智能‘教母’李飞飞创立了世界模型初创公司WorldLabs，据知情人士本月透露，‘AI教母’李飞飞正与投资者展开新一轮洽谈，该公司最新估值有望达到约50亿美元；早些时候的消息显示，‘AI教父’杨立昆的世界模型初创公司AMILabs在一轮融资中吸引了包括Cathay Innovation在内的潜在支持者，该轮融资可能使这位前Meta首席人工智能科学家的公司估值达到35亿美元；英伟达CEO黄仁勋早早表态，世界模型能助力实现‘物理人工智能’，自主操控机器人、自动驾驶汽车等设备；Meta的超级智能AI实验室与机器人团队合作，正是为了构建世界模型，通过模拟现实世界物理规律，为机器人提供空间感知和精细操作能力，弥补现有机器人的不足……

当然，作为初期成果，Project Genie为代表的世界模型仍非常不成熟。以Project Genie为例，该模型每次生成和探索的时间被严格限定在60秒以内，生成的世界在物理效果上可能不够逼真，有时无法精确遵循提示词或现实世界的物理定律，角色的操控也时常出现延迟或响应不精确的问题。此外，一些在早期演示中提及的高级功能，如通过即时指令改变世界事件，尚未在此版本中实现。

这些限制部分源于世界模型巨大的计算消耗，这也是当前AI模型技术面临的核心矛盾。DeepMind的研究人员坦言，用户每使用一次，背后都有一块专用的计算芯片为其服务。每一次看似轻松的‘造世’，背后都依赖专用计算芯片的全功率运转。这决定了它在现阶段，更像一扇仅供窥探未来的窄窗，而非可以随意出入的大门。

游戏或成世界模型的首个试水行业

谷歌DeepMind、WorldLabs等领先的AI团队都认为，世界模型可能会首先重塑游戏、影视行业。

传统的3D资产创建与场景搭建是人力与时间密集型的核心环节。Project Genie展示的可能性是，将部分前期概念设计、场景原型构建乃至动态分镜预览的过程，压缩至几分钟甚至几秒钟。这并非要取代专业的创作引擎，而是可能重塑创作流程的起点，极大地释放创意验证的速度。

DeepMind世界模型项目Genie3的联合负责人Shlomi Fruchter此前表示：‘软件开发，尤其是游戏开发，正在发生巨大变化，我预计在未来几年，这种变化甚至可能是彻底性的。’

去年年底，WorldLabs正式推出了其首款商业产品、由生成式AI驱动的三维世界生成系统，标志着该技术开始进入实际应用阶段。