编者按:他们创办的公司或已是独角兽,或刚启动种子轮,或已家喻户晓,或长期身居幕后,或正起于微末,但他们都是中国新经济的微观脉搏,是这轮产业和技术升级的微观主导者和实践者,不同行业成千成万的他们的身影汇聚,投射变革的洪流。
由财联社和《科创板日报》联合发起的 " 连线创始人 /CEO" 栏目,主要关注创新创业型企业,以企业创始人 /CEO 的访谈为一手信源,让成长中的创业公司走入公众和市场视野,并发掘最新技术和产业趋势。
《科创板日报》1 月 13 日讯(记者 李明明) 具身智能的下半场,竞争焦点已聚焦具身数据。
2026 年 CES 展上,黄仁勋抛出重磅论断:" 机器人的 ChatGPT 时刻正在到来 ",同时直言 " 脱离真实世界的数据,具身智能终将沦为幻觉 "。这一观点迅速引爆全球科技产业,释放明确信号:机器人行业正告别单一任务编程、依赖真实场景数据却效率低下的旧阶段,全面迈入以物理 AI 为核心的通用化发展爆发期。
事实上,国内资本早已敏锐捕捉到这场产业变革浪潮。2025 年下半年,行业完成范式升级,竞争维度从单一本体,升级为 " 本体 + 数据 " 双核驱动,更迈向 " 数据 × 模型 × 本体 " 协同发力的新阶段。
当前,具身智能领域在不同技术阶段与场景约束下,正并行推进四条核心数据路线,且每条路线均已形成清晰技术逻辑与产业落地方向:一是遥控真机路线,依托真实机器人执行任务获取数据,场景贴合度与数据真实性无可替代,但研发部署成本居高不下;二是仿真数据路线,凭借算力与仿真引擎生成海量合成数据,拓展性极强,却受限于仿真与现实的域差难题,难以完全适配真实应用;三是人类视频路线,通过采集大规模人类行为视频提取数据,成本与落地门槛最低,却易因场景还原度不足陷入应用误区;四是 UMI 数据路线,构建无本体依赖的通用化数据协议,打破硬件壁垒实现数据复用,通用性与适配性优势突出。
四条路线并行背后,国内具身智能赛道产业格局已初步清晰,智元机器人、银河通用、它石智航、鹿明机器人凭借各自主攻路线的深耕布局,成为业内公认的 " 具身数据四小龙 "。其中,2024 年 9 月成立的鹿明机器人,是国内布局 UMI 路线的先行者,率先推动通用化数据协议的场景落地。
海量、高质量的真机交互数据,是训练高性能机器人模型的核心基石,而行业长期受困于数据采集成本高、效率低,以及不同机器人本体数据无法互通的 " 数据孤岛 " 难题。鹿明机器人精准捕捉这一核心瓶颈,将突破方向锚定数据采集基础设施,其自主研发的 FastUMI Pro 无本体模仿学习数据采集系统,成为破局关键。
《科创板日报》记者近日对话鹿明机器人创始人、CEO 喻超,及公司联席 CTO 丁琰。其中,喻超曾任追觅具身机器人 ( Magic Lab ) 业务负责人,并首创全球首个空翻电驱动人形机器人。而其联合创立的鹿明机器人,正通过提供从数据采集设备、高质量数据集、行业解决方案到联合模型训练的全栈服务,构建完善的 UMI 数据生态体系。
喻超表示,相较传统遥操作采集方式,鹿明 FastUMI Pro 通过创新硬件架构与软件算法,将单条数据采集时长从 50 秒压缩至 10 秒,效率提升 5 倍,综合成本降至传统方法的五分之一;更关键的是,该系统实现了数据与机器人本体的解耦,可快速适配市面数十种不同机械臂、,有效打破了行业数据孤岛困境。
" 我相信 2026 年头部模型公司训练数据的规模一定是去年十倍以上的量级,整个具身数据市场相比去年一定是十倍以上的增长。"

UMI 相比传统数据采集方案效率提升 5 倍,成本降至 1/5
《科创板日报》:几年前 UMI 项目在学术界、产业界都相对冷门,当时为什么选择坚持做这个项目?
丁琰:2024 年 3 月我们开始启动 UMI 项目时,全球范围内从事该领域的团队寥寥无几,由于技术难度较高,很多团队都中途放弃了,在推进过程中,我们越来越坚信这个项目的价值和前景,最终取得了一个又一个的阶段性成果。
首先就是 FastUMI,我们从 2024 年 3 月左右开始做这个工作,中了当年的 CoRL 2025,将学术界工作带入了工业界。
另外一个工作是 FastUMI 100K。我们团队因此获得了大规模的数据治理经验。
UMI 领域的真正门槛并非设备本身,而在于能否采集到 " 可训练 " 的高质量数据。市面上许多 UMI 设备采集的数据存在视觉与位姿未对齐、传感器不同步、轨迹不可复现(replay)等问题,实为无法用于有效训练模型的 " 废数据 "。对此,鹿明首创了 " 为模型成功率负责 " 的系统工程范式,从硬件设计源头保障数据质量。
《科创板日报》:UMI 在成本降低方面有哪些表现?其市场定位和市场份额变化趋势是怎样的?
丁琰:UMI 在成本控制上优势明显,若不考虑机器人本体成本,其采集效率相比传统数据采集方案提升 5 倍,成本降低 1/5;若计入本体成本,成本降低幅度更大,可达 1/100 甚至 1/200。
从第一性原理来看,人手的采集效率最高,而 UMI 的采集效率已达 90%,接近人手水平,因此被认为是数据采集的终极解决方案。
市场份额方面,过去几年遥操作的市场份额达 95% 以上;但从 2025-2026 年开始,UMI 方案会迎来爆发式增长。
《科创板日报》:遥操作与 UMI 设备在数据维度上有什么差异?两者的适配算法有何不同?目前公司的客户合作情况如何?
丁琰:两者的数据维度差异不大,但适配的算法有所区别,遥操作的画面维度稍高,传感器数量与现行 UMI 设备不同,算法也从关节预测转向末端预测。UMI 的适用场景范围较大,可广泛应用于各类具身智能公司。
我们跟三菱、中远海运、德马科技形成了比较深度的战略合作。在场景里面落地的过程中,数据规模化又能带来智能化的提升。
目前全球具身智能行业内有超过三分之二的团队,正在使用 FastUMI Pro,2026 年这一比例还会进一步提升。
《科创板日报》:UMI 数据采集工厂的环境设计有什么要求?不同任务的采集环境是否存在差异?
丁琰:高质量的 UMI 数据采集依然需要严密的物理空间设计,甚至有着极其严苛的规则限制。如果无限制、无规则地自由发挥,产生的数据一致性将极差,最终导致模型无法收敛。这些关于空间设计的约束和技巧,是我们最核心的竞争力之一。
不同任务的数据采集环境存在明显差异,例如桌面级任务和移动操作任务,会采用不同的装置和采集规则。我们会制定一套复杂的空间引导规则,通过软硬件结合的方式,确保采集过程既具备现实世界的丰富度,又符合模型训练所需的逻辑一致性。
目前鹿明已有三个数据采集工厂,持续输出百万小时级的高质量具身数据。
《科创板日报》:UMI 在产业内的角色定位是怎样的?对于不同规模的企业(中小企业、初创企业、大公司)分别有什么价值?
喻超:对于中小企业和初创企业而言,UMI 因成本较低、数据质量高,是很好的选择;对于大公司来说,随着模型规模扩大,对数据量的需求达到海量级别,遥操作数据的成本过高,此时 UMI 大概率会成为更高效的解决方案,推动产业分工的升级。
计划在 2026 年实现 100 万小时的真机数据产能
《科创板日报》:公司在模型发展上有哪些策略?现阶段的模型规划是怎样的?
丁琰:我就是做模型出身的,我们在做的时候就发现——要想训一个非常好的模型,必须要有一个很好的数据管线,包括数据生产、数据评估、数据筛选,建立的过程本身就需要时间。
因此我们认为,不能上来就训模型,而是要把数据做到最极致。因为模型拼到最后,拼的不是模型架构,而是模型数据的质量,这是一个行业的共识。
目前我们的数据管线已搭建完成,可以源源不断地产生优质数据。
现阶段我们不会训练自有预训练模型,而是选择与产业方合作开发应用模型。

《科创板日报》:公司在数据量累积上有什么目标?目前的产能能否支撑该目标实现?
喻超:2026 年头部模型公司训练数据的规模一定是去年十倍以上的量级,整个具身数据市场相比去年一定是十倍以上的增长。
为了应对市场需求的爆发,我们正在通过与政府 / 产业方合作建设数采工厂等方式,加速建设数据采集产能,预计 2026 年实现超过 100 万小时的 UMI 数据采集产能,目标是建成全球最大的具身真机数据集。
《科创板日报》:目前公司面临的数据质量评估标准有哪些?公司的数据质量处于什么水平?
丁琰:我们将 " 可复现 " 作为数据治理的第一性原理,首创 8 道工业级数据质量评估体系,只交付 100% 可复现数据。
我们陆续收到了很多不同类型客户的数据质量评估标准,我们在给客户交付的时候,数据质量不仅符合这些标准,还远超要求。
比如工信部规定画面分辨率需达到 640 × 640 以上、频率 30 赫兹,帧率稳定性 2 赫兹;而我们实际的指标分别为 1280 × 1280、60 赫兹,帧率稳定性更是达到 1 赫兹左右,在构建生态和市场推广过程中,这一优势为产品竞争提供了有力支持。
《科创板日报》:数据与模型的适配、模型与本体的泛化都十分重要,能否具体解释你们是如何开展这两项工作的?
丁琰:这其中的交互比想象中更为复杂,核心可分为数据、模型、硬件(本体,非数采硬件)三大板块,同时数采硬件也起到关键作用。
数采硬件直接决定数据质量,而数据质量又会影响模型的智能上限,若数据质量不佳,模型训练必然难以达到理想效果。当数据与模型完成适配后,还需部署到本体硬件上,若硬件本体性能不足,模型的实际效果也无法充分发挥。三者之间是相互影响、相互促进的关系。
这也是我们专门为 UMI 研发专属机械臂的原因。我们即将发布一款最适配 UMI 数据的轻量型机械臂,希望通过算法与硬件的深度耦合,
让数据、模型与硬件形成最佳配合,将整体性能与表现推向极致。
《科创板日报》:之前了解到你们的技术路径在本体泛化性上表现突出,具体是如何实现的?
丁琰:以夹爪采集设备为例,我们的采集设备分为手持设备和机载设备。像宣传片中展示的那样,手持设备的夹爪上配备了摄像头,会记录夹爪的外观画面,同时还可搭载其他传感器。
在实际部署时,只要机器人夹爪的外观与摄像头参数和手持设备一致,无论所搭配的机械臂类型如何,采集到的数据都可以相互共用,这就实现了物理层面的本体泛化。


登录后才可以发布评论哦
打开小程序可以发布评论哦