DeepMind 掌门人 Demis Hassabis 关于 AGI 的分享,为AI 创业者给了一个新的思考方向。行业此前沉迷大模型参数竞赛,却忽略了 AI 对物理世界的认知短板,而 Hassabis 提出的 “世界模型 + 自动实验” 双轮驱动,恰恰点破了 AGI 落地的核心痛点。
更具有启发的观点是:与其在通用大模型赛道内卷,不如聚焦垂直领域的 “小闭环”。比如 DeepMind 用 Veo、Genie 让 AI 理解物理规律,用自动实验室突破材料研发,这种 “先解决具体场景问题,再沉淀通用能力” 的思路,正是中小创业公司的机会所在。
而 “科研闭环” 理念 ——AI 从提问到验证再到迭代的自主能力,这不仅是技术方向,更是商业模式的新可能。或许不必追求像 DeepMind 般的宏大叙事,但完全可以在医疗检测、新材料筛选等垂直场景,搭建轻量化的 “虚拟模拟 + 实体验证” 闭环,这才是当下更务实的破局点。
这条不靠参数堆砌、重在智能重构的道路,是否可以重塑了AGI的实现路径?人类与AI共同探索的未来又将是什么样?以下,Enjoy:
2025 年 12 月 16 日,Google DeepMind 播客更新了这一季的最后一期。对话 Demis Hassabis,全长超过 50 分钟。
不是发布会,也不是复盘产品。
开场一句就定了基调:别只盯着产品发布(look beyond the product launches)。聊的是未来十年最根本的两件事。
Hassabis说,通往 AGI 得先把两件事做成:
但更重要的是,这两件事必须连起来,形成一个完整的科研闭环:AI 能自己提问、自己验证、自己迭代。
Hassabis 认为,AGI 不是生成模型的终点,而是科研闭环的起点。
Hassabis 说,世界模型一直是他的核心关注点。这不是新想法,但到了2025年,不做不行了。
过去几年,语言模型会写、会答、会总结,看起来无所不能。Hassabis承认,语言包含的世界信息比预期多,甚至比语言学家想象的都多。但他指出一个矛盾:这些模型可以在国际数学奥林匹克拿金牌,却会在小学几何题上出错;它能生成惊艳图像,却不理解杯子为什么不会飘在空中。
问题出在哪?它们没有世界模型。
所谓世界模型,就是 AI 对物理现实的直觉理解能力,比如什么能倒、什么会动、东西会以什么方式变化,空间是怎么构成的,时间是怎么推移的。
更关键的是,很多东西根本无法用语言描述:传感器数据、电机角度、气味、触感。人类从小就靠身体学会这些,但语言模型只读过书、没接触过物理世界。
DeepMind 的解决方案是几个产品:
Genie 和 Sima 可以互相作用。Genie生成世界,Sima在里面探索,两个 AI 形成训练闭环。这可能让 AI 自动设置任务、解决任务,难度不断递增,无需人类介入。这是继 AlphaGo 之后,DeepMind 第二次尝试让 AI 自我进化。
但 Hassabis 也承认,这些模型目前只是“看起来真实”。
如果用牛顿三定律测试,会发现它们只是近似。对于机器人来说,这个精度还不够。DeepMind正在用游戏引擎创建物理基准,像做高中物理实验一样,测试 AI 是否真的理解了世界的运行规律。
如果你能模拟这个世界,那就说明你真的理解了它。
这也解释了为什么世界模型是 AGI 的前置条件。AGI 的目标不是更好的 chatbot,而是能在物理世界中行动的智能体。
从机器人到 AR 助手,再到终极游戏,所有这些都需要 AI 先理解物理世界如何运作。
简单说,世界模型是 AI 走出纯数字空间的必经之路。
语言模型能讲故事,世界模型能构建环境,但真正让 AI 参与现实的那一步,是实验。
Hassabis 说,我们做 AlphaFold 的时候,就想证明一件事:AI 不只是工具,它可以成为真正的科研参与者。
现在,DeepMind 正在把这件事做大。

(CNBC:在英国,DeepMind成立首个全自动化实验室)
2025 年 12 月 10 日,DeepMind 与英国政府达成合作,要在 2026 年建立DeepMind的第一个全自动化科学实验室。这是一台从头设计、完全集成Gemini的科研引擎。它每天能合成并测试数百种材料,由多学科研究团队监督,但实验的执行、数据分析、方向调整,主要由 AI 和机器人完成。
研究方向集中在几块硬骨头:
这些都不是模型生成个答案能解决的事,而是真要走进实验室、接触物质、试错迭代。
和 AlphaFold 比,差别在哪?
Hassabis 表示,这一步的意义不止是提效,更是让 AI 真正进入科学的内部流程。过去,AI 辅助的是科研周边工作:文献总结、图像识别、数据标注。现在,它开始参与假设提出、实验设计、数据验证,甚至能反过来修正最初的研究思路。
材料科学是最适合做这件事的领域。
因为它既需要大量试错(一个新材料配方可能要测试几千次),又有明确验证标准(测一下电阻、强度、熔点就知道行不行)。这让 AI 的自主实验成为可能。
速度是关键。Hassabis 提到的室温超导体、聚变材料,都是困扰人类几十年的问题。不是因为理论不够,而是因为试错太慢。如果 AI 能把材料筛选速度提升100倍,那能源革命可能真的只需要10年。
除了自动实验室,DeepMind 还在与美国核聚变技术研发商 Commonwealth Fusion Systems 合作,用 AI 帮助控制托卡马克反应堆中的等离子体。这是核聚变商业化的最后一道坎。
用 Hassabis 的话说:AGI 的前提不是更聪明,而是更能动手。
前两节讲的是两件事:世界模型让 AI 看懂世界,自动实验让 AI 动手验证。但真正让 AGI 变得可能的,不是它们各自有多强,而是它们能不能连起来,跑通一个完整的认知闭环。
Hassabis 的原话是:我们过去在训练回答者,现在要训练研究者。
什么意思?
关键在于如何让感知和行动形成循环。DeepMind的做法是:把第一节提到的Genie和Sima连接起来。
任务失败或成功,都成为 AI 自我学习的材料。两个AI在彼此的思维中互动,却不知道对方是谁。Genie 不知道 Sima 是另一个AI,它只是把Sima当成玩家。Sima也不知道世界是AI创造的,它只是在完成任务。
这创造了一个可能无限扩展的训练循环:Sima 想学什么,Genie 就能即时创造什么。你可以自动设置和解决数百万个任务,难度不断递增,完全不需要人类介入。
如果把这个循环抽象出来,你会看到一个完整的科研流程:
这个过程,过去只有科学家在做。现在,AI 开始具备类似能力。
这个循环不只是为了训练更好的模型。Hassabis 提到,同样的技术可以用来创造更智能的游戏 NPC,也可以用来训练机器人。因为机器人需要的能力和游戏智能体高度重叠:感知环境、规划路径、执行动作、从失败中学习。
Genie+Sima 形成的虚拟闭环,和第二节提到的自动实验室,构成了两个平行的自主研究系统:一个在数字世界跑通逻辑,一个在物理世界验证假设。
所以 AGI 不只是一个更大的模型,而是一个能自己生成任务、动手验证、推理更新的智能体。
简单说,它必须能像研究者那样工作。
Hassabis 给出的这条通往 AGI 的路线,不靠更大模型,也不靠更强算力,而是靠 AI 真正“理解世界”和“改变世界”的能力。
世界模型是基础,让 AI 看清因果;
自动实验是手段,让 AI 验证认知。
这不是模型优化,而是智能的重构。
未来,AI 会自己提问、自己试验、自己修正。到那时,我们对知识、科学甚至思维的定义,可能都得重新写一遍。