经济观察报 昨天
Momenta CEO曹旭东:物理AI的“门票”至少百亿美元
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

4 月 25 日,在 2026 北京车展上,Momenta 四位合伙人罕见同台,公司 CEO 曹旭东站在台上,身后的大屏幕上打出一行字:"Momenta R7,物理 AI 序章 "。

这一天,Moment 宣布:R7 强化学习世界模型实现量产首发,物理 AI 正式从技术理念走向规模化量产落地。

一周前,曹旭东刚刚和团队反复推敲过这个标题," 序章 " 这个词是他坚持的。他认为,智能驾驶正从 " 看见世界 " 走向 " 理解世界 ",物理 AI 的故事才刚刚开始。

这一天,Momenta 宣布了几组数据:累计定点车型超过 200 款,已交付超 70 款量产车型,搭载 Momenta 系统的量产车辆规模超过 80 万台。最快不到 40 天,就可以完成 10 万台交付。

对比三年前,Momenta 首个 10 万台量产用了整整 24 个月。" 飞轮效应正在加速形成。"Momenta 合伙人孙环说。

本届北京车展上,超过 20 个品牌、60 余款车型搭载了 Momenta 方案,包括梅赛德斯 - 奔驰、奥迪、宝马的新发布车型。在展馆里走一圈,几乎每走几步就能看到一辆搭载 Momenta 系统的车。

但曹旭东想讲的,不止是商业数字。他和团队把这场发布会的核心,留给了两个关键词:世界模型与强化学习。

从看见到 " 理解 "

曹旭东口中的 " 物理 AI" 指的是什么?他用了一个对比:大语言模型通过 Next Token Prediction 来压缩数字世界的常识,让 AI 学会了理解文本;而世界模型,则是通过 World Model Prediction 来预测物理世界的未来状态和交互逻辑,让 AI 理解物体的物理属性、运动的因果关系。

" 自主进化是智能持续迭代的关键动能。AI 在环境中,根据目标,不断接收反馈、试错迭代、自主优化。因此,世界模型与强化学习,共同构成物理 AI 的两大核心支柱。" 曹旭东说。

Momenta 合伙人、研发 SVP 夏炎进一步拆解了 Momenta 世界模型的三个层次。

第一层是预训练。通过海量真实驾驶数据的预训练,将物理规律、常识与因果关系压缩进模型,让系统形成对物理世界的基础认知。

第二层是仿真。将世界模型用于自动驾驶闭环仿真,让系统推演自身行为变化时世界将如何演变,对长尾场景进行性能评估。

第三层,是在世界模型中进行强化学习。在前两层基础上,为强化学习构建一个高度真实的虚拟训练场,让系统在接近真实的环境中反复探索与试错。

正是在这样的虚拟训练场中,系统从单纯的 " 模仿学习 " 走向 " 想象与探索 ",在虚拟世界中经历千万次推演,自主习得在复杂博弈中做出最优决策的能力。

Momenta 合伙人、研发 SVP 孙刚举了一个例子:日常行车中,如果前车意外掉落一箱苹果,搭载 Momenta 系统的车辆能够自主预判苹果滚落的轨迹与扩散范围,提前平稳减速、规划绕行路线,以更从容的方式处理突发路况。

" 现实世界中万中无一的极端场景,在虚拟练兵场里已被反复经历、充分消化。这一机制的目标,是让模型在罕见极端场景下的表现超越人类驾驶员。" 夏炎说。

" 贫矿 " 变钢铁

" 数据这件事,它不是单单的数据本身。你可以认为数据就是矿石,而且是含矿量很低的铁矿石。" 曹旭东在发布会后接受经济观察报等媒体采访,被问到 " 数据飞轮最大的瓶颈是什么 " 时,他打了这个比方。

市面上有一种说法是,获得大量数据没那么难,难的是用好数据。曹旭东认同这个判断。

" 你怎么把贫矿变成富矿?" 曹旭东举例说,高速上三只小狗排队横穿高速,这样的场景万中无一、万里挑一,把它挑出来,难度本身就是大海捞针。这已经有很高的门槛了。

从贫矿变成富矿,再从富矿变成钢铁,钢铁变成发动机,发动机最终装到车上,这才是最终的价值。" 拥有海量的原始数据,仅仅是一个价值源头的 10%,剩下的 90% 来自于这个体系的能力。" 曹旭东说。

Momenta 目前有超过 80 万台量产车在路上跑,可做到海量数据回流。在预训练阶段,这些数据通过 World Model Pre-Training 来训练模型,让它具备物理常识。但这还不够。

" 有物理常识不代表它是一个好司机。" 曹旭东说。他表示,大量数据里有好的驾驶行为,但更多的是不好的驾驶行为。这就像大语言模型的训练,通过海量数据输入,模型具备了世界的常识,但不代表它有好的行为习惯。还需要 Post-Training,把行为对齐到人类的好行为上。

按照官方说法,这套逻辑,Momenta 已经跑了十年。

" 敲门 " 敲八年

2017 年,奔驰投资了 Momenta。彼时,Momenta 还是一家成立不久的创业公司。曹旭东记得,当时奔驰的董事长觉得 " 这个公司特别有活力 ",所以选择投资。

但 Momenta 与奔驰的第一个量产项目上市,是在 2025 年下半年。从投资到量产,整整八年。

" 我当时问了一个清华的师兄,他告诉我说,你们跟奔驰合作量产至少需要十年。" 曹旭东说。他回忆,2017 年到 2020 年是 POC 阶段,2020 年到 2022 年是 Pre SOP,2022 年到 2024 年是小批量量产开发。2024 年,Momenta 拿下了奔驰所有电车和油车的业务。2025 年底,才真正量产。

曹旭东以此来说明汽车行业的特殊性:" 面向主机厂,国内 OEM 敲门敲三年,海外 OEM 敲门敲五到七年。"

这也是曹旭东判断智驾格局会快速收敛的依据。在他看来,自动驾驶有非常强的规模效应和先发优势," 它的效应会比芯片行业更强 "。

为了佐证自己的判断,曹旭东还复盘了芯片行业的历史:PC 时代的芯片,全球只有两家;手机芯片时代,全球也只有高通和联发科两家。而自动驾驶因为是软件,边际成本为零,规模效应更强。这种规模效应既体现在成本上,也体现在体验提升上,即数据越多,模型能力越强。

" 中国也就两到三家,全球也就三到四家,会非常快速地收敛。" 曹旭东说。目前,Momenta 合作的客户已经覆盖德系 BBA、大众,日系丰田、本田、日产,美系通用、福特。他表示:" 不光是今年,去年我们就已经是全球品牌的共同选择了。"

物理 AI 需要 " 门票 "

当被问及 " 物理 AI 被英伟达黄仁勋带火后,很多公司都说自己是物理 AI 公司,Momenta 在全球范围内处于什么位置?" 曹旭东的回答,从数字 AI 和物理 AI 的对比切入。

按照曹旭东的说法,数字 AI 在过去几年突飞猛进,很重要的原因是数据能快速、规模地获得。OpenAI 很早就同时做了机器人和数字 AI,但后来阶段性地放弃了机器人,选择做 GPT ——因为互联网数据已经是海量的,而机器数据的获取太难了。

" 但是,我们所在的世界,既有数字的部分,又有物理的部分。物理的部分可能是更大的一部分。" 曹旭东说。在他看来,当数字世界取得巨大进展后,经验和方法必然要进入物理世界,并在物理世界中做创新," 这就是为什么我觉得现在是物理 AI 的序章刚开始。"

曹旭东对物理 AI 有一个核心判断:最关键的,是数据闭环和商业闭环,而且两者是互动的。

曹旭东观察到一个现象,即任何一个人工智能的应用,一旦接近人类水平,就会在很短时间大幅超越人类。"AlphaGo 也好,人脸识别也好,接近人可能花了十年、二十年,但超越人、大幅超越人,可能就发生在一两年、两三年。" 他说。

这背后的逻辑是什么?曹旭东的答案是,先有数据闭环,才有足够好的体验。体验一旦达到或超过人类水平,就能实现爆发式商业化。商业化带来数据爆发式增长,数据增长又带来模型能力爆发式增长。最终互相促进、互相激发,形成强烈的正反馈。

" 自动驾驶进入到了这个阶段。机器人还需要一段时间。" 曹旭东说。

曹旭东同时认为,物理 AI 是需要 " 门票 " 的。" 自动驾驶要实现规模化 L4,累计投入至少是百亿美金。通用机器人呢?可能几百亿美金到千亿美金级别,这还可能是创业公司的研发效率。" 他说。

曹旭东的判断是,长期来看,靠融资做成通用物理 AI 是不现实的,一定要有现金流业务。这个现金流业务,可以是自动驾驶,也可以是其他方向。无论如何,一定要有一个现金流业务来支持物理 AI 的研发。

Momenta 选择的路径,是通过量产乘用车的规模商业化,支撑 L4 的研发。

但 Momenta 的 L4 不止 Robotaxi。曹旭东透露,Momenta 既做 Robotaxi,也做 Robovan 物流,明年还会做 Robotruck。逻辑回到一个核心理念:一个自动驾驶大模型,能够实现所有的垂直应用,并且做得更好。

" 这件事我们已经在 Robotaxi、Robovan 和乘用车上成功验证了。这带来的价值是,每个垂直场景的研发成本大幅降低,而每个场景的经验和数据又汇总到大模型里,让每个垂直领域做得更好。这是平台优势。" 曹旭东说。

曹旭东这个逻辑还类比了十多年前的互联网行业——垂直电商和平台电商并存,但最终胜出的是平台。他判断在自动驾驶大模型领域,也存在很强的平台效应。

" 东方硅谷 " 野心

发布会尾声,曹旭东讲了一段个人经历。十年前,他在硅谷看到一条以仙童半导体命名的街道 Fairchild Drive。正是这家公司,孕育了全球半导体产业的起点,最终铸就了硅谷的传奇。

" 那一刻,我心中的那团热火被点燃了。今天,我们希望携手所有中国 AI 公司,共同书写属于东方的硅谷传奇。" 曹旭东说。

谈到全球竞争,曹旭东提到一个观点:中国技术和产品进入海外市场,给当地用户带来领先价值的同时,也会带来一些对当地企业和就业的冲击。

" 比较好的解决方案,是借鉴中国之前的模式,做反向合资。让当地享受中国技术的好体验,同时中国技术赋能当地企业,带来更多发展和就业。这是一个共赢的模式。" 曹旭东说。

至于具体算法的中外竞争,曹旭东认为,在中国环境下,知识流动和人才流动速度很快,单点算法并不存在特别大的壁垒。真正的差距,在更深处,也就是体系和组织的差距。

" 架构能力比单点算法能力更重要。因为架构涉及取舍,好的架构能实现更好的积累和合力。而架构之上,是包含数据迭代、训练、验证的体系。体系之上,则是组织和文化。" 曹旭东说。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论