物理AI时代核心“卖铲人”：数据采集是机器人下一个风口？

人工智能的底层逻辑正从大语言模型的 " 语言理解 " 转向世界模型的 " 预测世界 "。在这一跃迁中，物理数据的质量与采集能力成为发展核心。作为解决世界模型与具身智能 " 数据燃料 " 问题的关键，具身数据采集正开启下一代数据基建浪潮。

国泰海通最新报告指出，具身智能发展的最大障碍已不再是算法，而是数据缺口。其对数据的需求量呈指数级膨胀，远超传统 AI 模型。在这一背景下，能够率先填补数据缺口的数据供应商与基础设施商，将作为物理 AI 时代的 " 卖铲人 "，占据产业链核心价值节点，有望享受显著的估值溢价。

技术路线上，真实数据、仿真 / 合成数据、视频数据各有利弊：纯真实数据成本过高，纯仿真数据存在 "Sim2Real"（仿真到现实）鸿沟。未来主流路径逐渐清晰：仿真 / 视频数据用于大规模预训练 + 真实数据用于微调与强化学习。

随着主流技术路线日渐清晰，资本正加速涌入数据采集工具链（动捕、遥操作）、视频数据升维平台及仿真训练场——这些数据采集基础设施，正成为机器人产业真正的风口与 " 铲子 " 生意。

范式转移：世界模型重塑 AI 基石，数据需求膨胀至 EB 级

AI 正从 " 数据相关性 " 驱动转向 " 物理因果性 " 驱动，2025 年已成为世界模型应用落地的元年。具身智能对数据的需求量及复杂度正呈指数级爆发。

传统神经网络与大语言模型本质上依赖模式识别与概率关联，而" 世界模型 " 的核心在于内建物理规律（如重力、惯性），并具备预测时空演化的能力。自 2025 年起，该领域迎来集中突破：Meta 的 V-JEPA 2、谷歌的 Genie、OpenAI 的 Sora 以及 World Labs 的 RTFM 相继问世。

世界模型将赋能游戏、自动驾驶与具身智能三大核心场景。其中，具身智能的爆发对数据提出了前所未有的苛刻要求。与大语言模型及自动驾驶（PB 级数据量、以文本或视觉为主）不同，具身智能需适应形态各异的硬件平台，数据需求高达 EB 级，且极度强调物理交互（力觉、触觉、关节反馈）。目前行业仍处早期阶段，预训练数据极度紧缺，" 数据孤岛 " 与异构数据融合难题已成为制约产业爆发的核心瓶颈。

三大主流数据采集方案利弊共存，视频数据成为业内关注新焦点

构建高效的数据闭环，是具身智能能力跃升的核心。当前，资本与技术主要围绕三大数据采集方案展开：

真实数据（高保真但极度昂贵）：通过遥操作、穿戴式动捕等方式直接采集。优势在于不存在 Sim2Real 差距；致命短板是成本高、扩展性差，难以覆盖长尾边缘场景。

合成 / 仿真数据（高性价比但存在迁移鸿沟）：利用物理引擎在虚拟环境中生成。成本极低且自带完美标签，但面临显著的 "Sim2Real Gap"（动力学、感知、控制等差异），导致模型在真实环境中性能衰减。

视频数据（来源广但直接应用难）：业内新兴焦点，通过升维技术利用海量互联网视频。成本低、规模大，但缺乏物理交互属性（如重力、摩擦力），噪声大且缺少精确的三维标注。

产业演进趋势：Generalist AI 的 GEN-0 模型（≥ 7B 参数）已证明，在海量真实交互数据下，模型性能呈幂律增长。在真实数据成本被彻底打下来之前，" 仿真 / 视频数据预训练 + 真实数据微调 / 强化学习 " 的虚实结合方案将是绝对主流。

与此同时，底层数据基建正在国家力量与开源生态的推动下加速成型：上海落地了全国首个具身智能领域国家级标准化试点（"1+N" 模式训练场），北京建立了首个基于真实场景的数据训练基地。谷歌、星海图、傅利叶、智元等纷纷发布开源数据集，中国信通院则牵头制定了国内首个具身智能数据集质量评价标准。

机器人本体厂商的 " 数据站队 " 与战略分化

正是由于真实数据成本高、仿真数据存在迁移鸿沟、视频数据噪声大，国内外主流机器人本体厂商在数据路线上出现了明显分化。这一分化，反过来为数据采集基建的方向提供了最直接的产业验证。

真实数据优先派：认为只有真实交互才能跨越 Sim2Real 鸿沟。智元机器人在大模型训练阶段 100% 使用真机真实数据，仿真仅用于工程迭代；自变量机器人在复杂物理交互场景中完全不使用仿真数据；1X Technologies 同样将 " 大规模真实世界数据 " 作为核心壁垒。

合成与仿真数据优先派：押注成本与规模。银河通用采用 99% 的合成数据配以 1% 的真实数据进行训练，试图以极低成本逼近真实分布。

视频数据战略高地：特斯拉、Figure AI 等巨头正加速布局，核心逻辑在于互联网视频规模远超任何单一机器人平台能采集的真实数据。特斯拉 Optimus 已放弃早期动捕与遥操作，转向深挖互联网视频；千寻智能 Spirit v1 的 70% 预训练来自互联网视频；Figure AI 启动 Project Go-Big，探索人类视频到机器人的零样本迁移；星动纪元、逐际动力则分别采用 " 视频预训练 + 真机微调 " 及多源数据组合策略。

这三条路线的并存恰恰说明：当前尚无单一数据来源能独立解决具身智能的数据瓶颈。无论最终哪条路线收敛，数据采集工具链、仿真平台与视频升维技术——即物理 AI 时代的 " 卖铲人 " ——都将是确定性受益的方向。

数据 " 卖铲人 " 全景图

随着具身智能对数据的需求量级与复杂度指数级上升，能够有效解决数据获取成本与效率问题的供应商，正迎来一轮估值重估。这一重估覆盖四个关键方向：视频数据转化、仿真平台、多模态硬件采集，以及综合数据服务。

视频数据转化方向：核心突破在于将海量互联网视频低成本转化为机器人可用的训练数据，部分方案已能将综合采集成本降至行业平均水平的千分之五以下。

仿真平台方向：全链路合成数据体系以极低成本生成带完美标注的大规模虚拟数据，并逐步缩小 Sim2Real 差距。

真实数据采集硬件方向：光惯融合手套、电子皮肤等传感器结合高质量开源数据集，正在构建高保真底座。

真实数据生态与遥操作方向：大规模自建采集场景与高精度遥操作设备，已成为主流微调数据的重要来源。

在二级市场视角下，综合性数据服务商通过多元方案（遥操作、动捕、合成数据）建设具身智能数据训练场与工程化平台；仿真平台公司则通过收购整合打通虚实数据壁垒，提供全生命周期物理 AI 解决方案。

整体来看，无论是视频转化、仿真生成、硬件采集还是综合服务，能够显著提升数据 " 可获得性 " 与 " 成本效率 " 的供应商，正在从产业边缘走向估值中枢。

宙世代

一起剪

相关标签