汽车观察Autoobserver 2小时前
在商汤绝影总部,与王晓刚共话汽车AI“温度”与“铁壁”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

初冬的上海,云层低垂。

在黄浦江湾流经的拐角处,商汤科技大厦的建筑形态简洁到近乎抽象,犹如一艘停泊在工业文明旧址上的未来方舟,以无畏者的姿态,驶向已知又未知的智能世界。

一家以视觉感知立命的 AI 公司总部大楼,本身也在挑战着观看者的视觉常识。《汽车观察》记者此行目的,是与商汤科技联合创始人、执行董事,商汤绝影董事长王晓刚,共话汽车 AI" 温度 " 与 " 铁壁 "。

位于上海漕河泾的商汤科技总部大楼

犹如一艘航行于数字文明洪流之上的未来方舟

不止视觉霸主,再拓汽车疆土

连续九年占据中国计算机视觉市场榜首,GenAI IaaS 领域跻身行业前三,座舱视觉 AI 软件市占率连续五年位居全球第一,城市 NOA 市场份额位列行业前三……作为中国 "AI 四小龙 "(商汤科技、旷视科技、依图科技、云从科技)之首,商汤科技的市场地位不断向 " 生态话语权 " 升级。

然而,这家中国最大的人工智能算法供应商的 " 汽车故事 ",并非始于对造车风口的追逐,而是源自一次全球顶尖汽车制造商的主动叩门。

追溯其智能汽车业务布局,始于 2016 年。当时,排名全球前五的汽车制造商——本田来到中国,寻找智能驾驶领域的合作伙伴,经历多轮筛选后,将目光锁定在商汤科技上。次年 12 月,本田技研工业株式会社与商汤科技签订了长期的联合研发协议,共同研发适合于乘用车场景的 L4 级自动驾驶技术。

这次合作,为商汤科技打开了一扇通往智能汽车的大门,同时也开启了一段技术理想与商业现实的碰撞之旅。2021 年 7 月,商汤科技正式发布智能汽车解决方案独立品牌—— SenseAuto 绝影,标志着其汽车业务从幕后技术赋能走向台前品牌化运作。

商汤科技联合创始人、执行董事,商汤绝影董事长王晓刚

接受《汽车观察》独家专访

" 此时,自动驾驶前装量产技术快速发展,国际 Tier-1 巨头的技术优势逐渐被本土科技公司超越,智能座舱也从单点功能升级为整体体验,大模型时代的到来,更加印证了智能化是汽车的未来。" 王晓刚肯定道。

2022 年,商汤科技成立 " 绝影智能汽车事业群 ",使其汽车业务从内部的创新项目升格为与智慧商业、智慧城市和智慧生活并列的四大核心业务之一。时至今日,商汤绝影已经完成了从内部事业群到独立商业实体的快速成长。

由此可见,商汤绝影以聚焦投入、快速响应、专业深耕市场需求的战略选择应对智能汽车赛道,同时也让商汤绝影在汽车领域的定位更加清晰——不做造车的 " 躯体 ",而是与客户携手共建赋予汽车 " 灵魂 " 的智能座舱、智能驾驶与提供智能汽车云服务。

在求稳与开拓之间

商汤绝影这段 " 孵化 - 成长 " 的商业故事,亦是中国 AI 企业从技术研发走向产业落地的典型样本。截至目前,商汤绝影合作车企已超 30 家,既有一汽、东风这样的央国企,也有吉利、奇瑞、长城这类民企,更有跨国车企本田、新势力车企蔚来等。

" 不同车企给了我们不同的帮助,共同促成了商汤绝影的成长。" 王晓刚表示,这些不同属性、不同特质、不同体量规模的主机厂,对于智能驾驶和智能座舱的理解以及合作诉求有着明显的不同。

有的车企是科技属性和创新第一优先,更看重技术的前沿性、定制化与可迭代性。而且敢于在合作中共同探索,并能基于市场需求提供大量宝贵意见。

有的车企对科技发展的探索成本较为谨慎,核心诉求是稳定可靠、成熟落地,更加关注技术的安全性和市场验证度,稳步推进、不做炫技式开发。

再者就是本田这类跨国车企,其显著特点是技术前瞻性强,更偏向于长期技术布局。早在 2017 年,本田就已提出无图纯视觉端到端的技术需求,这在当时属于极具前瞻性的技术方向,为商汤绝影 2022 年推出 UniAD 端到端自动驾驶方案提供了重要的方向性指引。这类车企更注重技术的底层逻辑和可持续性,而非短期的落地速度。

" 单纯向主机厂提供技术服务,并非我们唯一发展路径,这种商业模式并不具备高利润属性,我们更希望与主机厂共同推进项目落地。" 王晓刚解释道,与主机厂的合作依然至关重要,这涉及大规模量产落地、技术迭代优化以及行业影响力的构建。

但在秉持开放态度的同时,也要有着自身底气与自信。在王晓刚看来,随着智能化技术的持续进步,必然会涌现出新的赛道和新的商业模式:" 商汤绝影作为一家科技公司,目标是保持技术的领先性,同时积极探索新的商业模式、开拓新的赛道,谋求长远发展。"  

智驾"奥斯卡"得主密钥

作为行业首个量产、可交互的世界模型," 开悟 " 一经问世便屡获国内外大奖。2025 年 8 月,还获得了由汽车观察传媒、中国国际贸易促进委员会汽车行业分会和中国汽车芯片产业创新战略联盟共同主办的 " 智輅奖 " 智驾系统解决方案组大奖。

相比华为、英伟达和谷歌等," 开悟 " 世界模型有哪些差异化优势?众所周知,世界模型本质上是一种大型仿真器,Alpha Zero 的案例已说明这一点。其核心价值在于特定规则框架下,通过自主交互产生突破人类上限的超级智能,这点对自动驾驶领域同样关键。

商汤绝影 " 开悟 " 世界模型荣获 2025" 智輅奖 "

" 实现这一目标的关键难点,在于仿真需精准契合物理世界规律、人机行为逻辑及交通规则,这也是当前行业很多世界模型的短板——仅能生成视觉效果尚可的视频,但缺乏对物理规律、因果关系的深度还原,且精度不足,难以适配自动驾驶实际需求。" 王晓刚对 " 开悟 " 世界模型技术亮点进行了三点概括。

亮点一,多模态输入融合。区别于常见的仅以视频为输入的模式," 开悟 " 为模型提供了多摄像头画面、相机姿态、3D 点云和人车物 3D 轨迹等多维度数据,通过多重约束让模型从不同模态中精准学习物理规律,实现更全面的世界仿真。

亮点二,高质量 + 高可控性。基于多模态融合的优势," 开悟 " 生成的高质量视频占比超 50%,远超行业平均水平,且能精准控制天气、光线和道路结构等元素,高度匹配自动驾驶 " 举一反三 " 的灵活需求,只需针对一个问题场景优化,就能覆盖成百上千个相关衍生场景。

亮点三,长时复杂仿真能力。当前行业标杆特斯拉可生成 6min 复杂交通交互视频,其他厂商多集中在 20-30s," 开悟 " 则已实现两分半钟的长时仿真,未来目标是看齐并超越特斯拉,实现更长时长、更复杂场景的模拟。

量产实力派的野心

目前," 开悟 " 世界模型已经量产,并赋能上海自动驾驶实训场。关于 " 开悟 " 世界模型的未来规划,王晓刚表示,明年的核心目标是推动 " 开悟 " 世界模型与强化学习的深度融合,逐步摆脱对真人驾驶数据的依赖,最终实现自动驾驶水平超越人类。

谈及 " 开悟 " 世界模型量产落地的最大难点,王晓刚强调,生成数据的质量与算力适配两大方面同等重要。若生成数据质量不达标,后续还需额外投入大量人力筛选校验,将直接导致整体研发效率大打折扣。

而在算力与芯片适配上,以前行业普遍依赖英伟达芯片,其成熟的生态体系大幅降低了适配难度;但如今面对各类不同规格的国产芯片,需要投入大量精力去完成适配工作,这一过程虽耗时费力,但也是提升模型运行效率的必要环节。

另需关注的是,商汤绝影推出的生成式智驾 R-UniAD,引入了独特的 VLAR 架构,这意味着决策逻辑已从 " 被动模仿 " 转向 " 主动生成与试错 "。然而,这套 VLAR 架构更多是依赖 " 绝影开悟 " 世界模型生成的海量合成数据,还是依然需要结合一部分真实世界采集的高价值人类驾驶数据进行混合训练?

王晓刚分别解释了这两种数据源在解决自动驾驶长尾问题中的权重:真实数据只是 " 冷启动 ",为 VLAR 架构提供了初始的训练基础;但启动之后,整个训练过程将进入持续循环的强化学习阶段,则主要依赖 " 开悟 " 世界模型生成的海量合成数据,来完成模型迭代更新,这也是未来自动驾驶技术的发展趋势。

从底层技术架构破局

汽车智能化比拼越来越卷,很多车企甚至把 " 堆配置 " 作为一种营销手段。对于科技公司而言,追求极致参数更重要,还是优先解决用户场景痛点更重要?

" 必然是以用户为导向、以场景为导向,而非单纯追求极致参数。但用户往往难以清晰表述自身核心痛点,在全新技术落地前,缺乏相应的认知与体验,这就需要我们主动挖掘并解决用户场景痛点。" 王晓刚回答道。

实际上," 堆配置 " 的深层原因在于传统 AI 的技术范式局限:以往 AI 功能都需要用户主动打开 APP 才能使用,本质上是 " 人找功能 ",而非 " 功能找人 ",这与用户对智能化的真实需求脱节。

" 只有先改变底层技术架构,摆脱传统‘激活式 AI ’的束缚,后续开发的各类应用才能真正解决用户痛点。" 王晓刚强调,商汤绝影基于 " 以人为中心 " 的环境计算理念,既跳出了 " 堆配置 " 的内卷,又能让技术真正服务于用户。

2025 年王晓刚位列全球顶尖 1000 名计算机科学家

世界第 29、中国第 1

在他看来,未来的 AI 不应是被动等待激活的工具和冰冷的功能集合,而应是融入周围环境、时刻关注用户需求与状态变化、充分感知及理解用户习惯与偏好,在用户需要时主动提供服务,既做到恰如其分,又不冗余打扰。

今年 10 月," 绝影千机 " 与奇瑞的深度合作,让大家看到了智能座舱发展的第 3 个阶段——走出 APP。从过往 2D、3D 环境,到强调从 4D 时空理解环境,商汤绝影是如何实现这一技术跃迁的?

王晓刚始终认为,智能座舱 " 走出 APP" 的核心逻辑是 " 以人为中心 ",实现这一目标需要三点技术支撑:第一,多模态大模型须持续运行于车端;第二,系统须具备长程记忆能力;第三,须采用更复杂的架构设计。

" 长链条闭环对技术提出更高要求,任何一个环节出错都会直接影响用户体验。商汤绝影通过架构层面的优化迭代,保障了 AI 与人在长链条复杂交互过程中的丝滑性与准确性,即便技术迭代难度显著提升,也能确保虚拟世界中的训练策略在迁移至真实物理世界后,安全可靠落地。" 王晓刚补充道。

下半场的攻坚清单

智能化下半场竞争已然进入白热化阶段,科技公司与主机厂一样,也要面临着残酷的淘汰赛。未来,商汤绝影如何持续不断地激发自身研发活力,站稳行业领先地位?

在王晓刚看来,讨论焦点应跳出 " 某一领域仅剩几家企业 " 这样的存量竞争思维,转而聚焦在新赛道的开辟与新机会的挖掘上,若仅局限于供应商这种单一角色,未来发展难免受限。接下来,商汤绝影将在商业模式与新业务方向上主动寻求突破。

与此同时,王晓刚也敏锐洞察到,智驾技术的演进正催生着全新机遇。自 2025 年起,无人物流车市场已迈入快速增长期;未来两三年内,Robotaxi 技术也将逐步走向成熟。这些都为商汤绝影开辟了全新的商业模式——直接面向终端用户提供出行服务。

沙利文发布《2025 年中国世界模型发展白皮书》报告称,商汤绝影 " 开悟 " 世界模型在技术产品、应用能力及生态建设三方面综合评价位居榜单第一。

过去,科技公司提供的多是单点座舱技术及相关解决方案,需经主机厂整合后才能触达用户,这种模式会导致 AI 功能的激活率与使用率始终处于低位。如今,以商汤绝影为代表的科技公司正突破座舱边界,使其技术不再局限于舱内,还能在舱外与手机、家庭机器人等设备跨场景联动。

那么,智能化下半场还有哪些前沿技术更具开发性和市场潜力,或将成为下一阶段的主流和攻坚方向?商汤绝影是否进行了相应的技术储备?

王晓刚认为有三点:第一,世界模型与强化学习的融合技术;第二,Human 3.0 相关的环境计算技术;第三,智舱与智驾的融合技术,在无人场景中的重要性愈发凸显。针对这些前沿方向,商汤绝影已经进行了相应的技术储备,以顺应智能化下半场的发展趋势。

" 智能化发展已进入全新阶段,技术形态、产品载体与商业模式,都发生了全方位的变革,科技公司也不再局限于供应商的角色,而是从 B 端向 C 端拓展。其中,以具身智能机器人为载体的 C 端应用,能够将技术更直接地触达终端消费者,这为下半场竞争开辟了新的赛道。" 王晓刚强调,唯有持续创新、不断突破原有边界,才能牢牢把握住蕴藏的机遇。

推荐阅读

点击" 在看 "与世界分享

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

商汤科技 王晓 商汤 汽车ai 上海
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论