
行业正进入比拼工程体系、组织耐力和成本控制的 " 苦工期 "。最终胜负,取决于谁能率先建立起支撑长期竞争的工业能力
文|《财经》特约撰稿人 宋立伟 赵成
12 月的深圳,苏箐站在 2025 地平线技术生态大会上说的第一句话是:" 我其实有点无话可说。" 这位被视为中国自动驾驶行业核心技术力量之一的人物,同时也是地平线副总裁与首席架构师,用这样一句近乎 " 泄气 " 的话开场,让现场略显意外。
刚从紧绷的量产周期中抽身,他对行业的判断也显得格外克制。在苏箐看来,自动驾驶的大方向正在变得更加清晰,但由此暴露出的难度同样开始回归真实世界。
因此,他的演讲与行业近来高涨的兴奋氛围之间形成了明显的反差。苏箐肯定 2024 年在技术路径上的关键意义,同时提醒同行 " 别太嗨 " ——未来几年未必是 " 再造奇迹 " 的窗口,而是一段拼工程体系、拼组织耐力的长周期。

地平线副总裁兼首席架构师 苏箐 图源:企业
这种冷静并非只来自工程端的经验判断,市场端的迹象也在同步显现。中国汽车工业协会常务副会长兼秘书长付炳锋指出,2025 年前十个月,中国新能源汽车销量达到 1294.3 万辆,渗透率逼近一半;具备组合辅助驾驶系统的新车渗透率突破六成。智能驾驶正快速从 " 可选项 " 滑向 " 必选项 "。
但若把时间拨回两三年前,这条赛道的推动力仍主要来自想象力。模型可以继续做大,演示视频可以更炫,但与 " 人类司机的自然度 " 之间依旧隔着明显鸿沟。苏箐坦言,那时的自动驾驶,本质上仍像一台靠应激反应驱动的机器。
直到特斯拉 FSD V12 出现,把感知、决策、控制真正串在一条数据链路上,让业内第一次看到:端到端不仅存在于论文中,也可以在真实道路上跑通。机器或许真的能从海量驾驶数据里学到那些难以写成规则的 " 潜规则 "。
方向因此更确定了。但方向确定之后,行业的真正难题也随之浮出水面:在一个路径更清晰的时代,自动驾驶接下来要解决的到底是什么?
人类最擅长的那部分,
机器最难学
苏箐在演讲中提出的第一个判断,就带着明显的 " 反直觉 " 意味:越是人类觉得困难的工作,比如高等数学、复杂推理,对计算机反倒更容易;但越是人类从小习得的本能,比如开车、会车时的眼神交流,对机器来说却是最难跨过去的。驾驶在他看来已属于这种 " 天生技能 " 的范畴。
从外部看,人们往往会轻易得出一种结论:既然人类经过一段时间的学习就能开车,机器应该更容易做到。但在工程端,事实恰恰相反。苏箐把自动驾驶工程师的工作形容为 " 在稠密的物理世界里处理连续事件 " ——量产节点不会停止,车每天都在路上跑,新场景与长尾问题源源不断,没有人能跳过。
回到几年前,行业普遍觉得系统 " 基本能开 ",但用人类司机的标准衡量,差距仍然明显:大量场景处理不了、行为生硬、不自然,自动驾驶看上去更像一个随时可能被触发的应激系统。
2024 年,特斯拉 FSD V12 的发布成为他眼中的转折点。那是第一次看到端到端方法不是停留在实验室,而是在真实车辆上跑通——不再是感知依赖数据、决策规控依赖规则,而是整条链路交给数据学习。他把这种体验比作看到 " 核裂变实验 ",其意义不在于结果有多完善,而在于路径被证明可行。
但正因为路径确定,他对未来三到五年的判断显得更加冷静。他认为,目前看不到新的理论突破,"AI(人工智能)和 AGI(通用人工智能)的基础理论在未来三到五年可能不会出现全新跃迁 "。相应地,自动驾驶将进入一个以工程能力为主导的阶段。
哪怕如此,他仍提出一个相当激进的工程目标:在未来两到三年,把系统的 MPI(平均每千公里接管次数)提升到 5 万公里,甚至 10 万公里一次,同时做到类人化与全区域泛化。这些目标并不耸动,却让 " 方向已定,但难度极大 " 的现实更加清晰。
半截革命被补完,
方法从 " 加法 " 变成 " 减法 "
当行业开始回顾自动驾驶 20 多年的技术演进时,苏箐选择从最早的车队讲起:CMU(卡内基梅隆大学)时代高度依赖非视觉传感器,几乎所有能力都靠人工编码堆叠;斯坦福团队引入机器学习后有所突破;再到 Google、Waymo,把深度学习推到更大规模。过去这些阶段看似连贯向上,但在他眼里,这场 " 革命 " 其实只完成了一半。
原因在于,深度学习主要重塑了 " 看得见 " 的部分——识别车辆、行人、信号灯等动态目标的确因此被带上新台阶;然而在静态的知识体系中,包括道路结构、优先级、策略选择等仍需要依赖高精地图补齐。
更关键的是,在感知之后的决策、规控环节,大量逻辑依然由规则控制。结果就是系统前半段数据驱动、后半段规则驱动,组合在一起,始终没有产生 " 彻底换一种技术逻辑 " 的感觉。
在这种背景下,2024 年之后的解决方法,其分歧变得愈发明显。一部分团队继续沿着 " 模块堆叠 " 的路线前进:针对不同场景、不同动作开发独立能力点,让系统像填空题一样在二维平面上堆满功能模块;另一部分团队则选择只种 " 一棵树 ",即用一条大模型链路覆盖尽可能多的能力,等它在足够数据的喂养下自然长高、长粗。

地平线副总裁兼首席架构师苏箐 图源:企业
苏箐显然站在后侧。他举了一个内部测试的案例:团队并未开发 " 靠边停车 " 的独立功能,但在一次绕行测试中,车辆主动变到了边道,动作舒缓、合乎直觉,这也让他意识到新的方法可能会自然长出能力,而不必逐模块堆叠。他由此判断,自动驾驶未来的路径更像 " 减法 ":先把人类驾驶数据全部集中起来,再把不需要的部分逐步减掉,而不是像过去那样,把能力点一项一项往上 " 加 "。
但这种方法带来的压力却直接而沉重。模型规模变大、链路变长之后,每次训练的成本都在攀升;模型行为不收敛、噪声导致的系统失效等问题也变得更加突出。他坦言,做一轮完整试验动辄就是十几亿元,还不一定成功。对于任何一家企业而言,这都意味着必须重新审视自己的真正壁垒——不是某个聪明的想法,而是能否支撑长期不确定性的工程体系与组织能力。
这些讨论延伸到 L4 级自动驾驶,也让行业看到了另一种对比。传统 L4 级自动驾驶在追求极低 MPI 时,往往不得不叠加高精地图、豪华传感器,再把运行域切得很小,在每一块区域里反复打磨。这套方法能拿到亮眼数据,却极难大规模复制。换句话说,这种线性扩展在 " 全平坦世界 " 下很难走远。

地平线副总裁兼首席架构师苏箐 图源:企业
当端到端方法跑通之后,他在开发中看到的变化十分直接:城市泛化速度大幅提升,在绝大多数城市测试时 " 天然没有问题 ",只剩下极少量的长尾场景需要处理。这种变化让他相信,同一套方法有机会在成本可控的前提下,同时服务乘用车与 Robotaxi。
方法论的分野仍在持续,但行业正在靠近一个共识:故事可能没有以前那么好讲了,但真正能把自动驾驶带进现实世界的,恰恰是这些 " 看上去不那么浪漫 " 的工程进展。
当城区 L2 级辅助驾驶像自动挡一样普及,
竞争将回到工程与组织能力
谈及未来阶段的重点,苏箐把话题拉回了 L2 级城区辅助驾驶。他给出了一个简单却很能说明问题的类比。高阶城区辅助驾驶未来会像自动挡一样,不再由价格带决定体验好坏。10 万元的车、30 万元的车、50 万元的车,自动挡的好用程度不会有本质差异;那么 Urban L2(城区二级辅助驾驶),也终将走向同样的状态。
支撑这一判断的,是他对计算机工业规律的理解:突破的代价极高,但复制成本极低。一条复杂能力链路可能需要庞大的资源投入才能第一次建立起来,但一旦路径被验证,后续复制到更多芯片、更多车型的边际成本会急速下降。
他用一句带有强烈工程味道的话来形容这种趋势:再复杂的计算机,只要给它几年的时间," 都会跟白菜一样 "。
因此,他认为接下来最重要的是 " 能不能以足够低的成本与足够快的节奏把 Urban L2 做得稳定 "。一旦这一点被攻克,10 万元级别的车型具备城区二级辅助驾驶能力将成为自然结果,而不是宣传亮点。
但想做到这一点,行业首先要面对的是更高的成本压力。
中国市场长期处于价格战之中,主机厂利润空间被不断压缩,而自动驾驶不仅需要算力、算法、软件、数据等多线投入,还必须在量产体系中处理海量长尾场景。这意味着企业要在三到五年内,既把系统做到足够稳定,又把单车成本压到合理区间。
在这里,苏箐把 " 工程能力 " 和 " 组织能力 " 称作一家公司真正的 " 工业母机 "。他强调,决定一家企业能否穿过下一个不确定性阶段的,不是一次性引入某项技术的勇气,而是组织是否具备持续吸收新技术、处理由此带来的爆发性问题、在大规模量产环境下消化长尾场景的能力。这类能力往往不显眼,但却是自动驾驶系统能否从实验室走向日常使用的关键前提。
类似的思路,也出现在产业链其他技术型企业的演进中。12 月 8 日,刚刚登陆港股的纳芯微(02676.HK;688052.SH)同样将组织能力视为公司突破发展瓶颈的重要基础。在其创始人兼 CEO(首席执行官)王升杨看来,强化组织能力是公司对抗竞争以及出海等不确定性的核心底气与关键支撑。
产业链的其他参与者也在从不同角度补全这幅图景。付炳锋提醒,芯片企业与整车企业之间在软硬协同上的效率仍需提升,端到端模型带来的测试评价体系、数据安全、预期功能安全等关键领域,也需要行业尽快形成共识。
跨国车企则在加速本地化研发,例如大众汽车集团已将原本由德国总部承担的部分开发任务转移至中国,以适应最快速的市场节奏。本土车企方面,则更多从生态协同的角度思考角色定位:哪些能力应由芯片与算法企业承担,哪些体验需要由主机厂主导,从而在更合理的专业分工下,提升整体效率。
在这样的竞争框架下,未来三年看似不会出现太多能够被拿来庆祝的 " 里程碑时刻 ",但它们很可能决定哪些玩家能够穿越下一轮技术周期。


责编 | 张生婷



登录后才可以发布评论哦
打开小程序可以发布评论哦