这场对话不仅揭示了机器人技术突飞猛进的核心密码,更勾勒出未来十年人机共生的清晰路径。
在 2025 年的英伟达 GTC 大会上,一场围绕人形机器人行业的技术圆桌引发全球关注。波士顿动力 CTO Aaron Saunders、1X 创始人 Bernt Bornich、Skild AI 创始人 Deepak Pathak、英伟达首席科学家 Jim Fan、Agility Robotics CTO Pras Velagapudi 等五位行业领袖齐聚一堂,从技术突破、硬件瓶颈到未来图景,展开了长达三小时的激烈碰撞。这场对话不仅揭示了机器人技术突飞猛进的核心密码,更勾勒出未来十年人机共生的清晰路径。
图片来源:2025 英伟达 GTC
机器人革命的三大引擎:模型、数据与硬件的协同进化
-突破莫拉维克悖论的技术密码
英伟达科学家 Jim Fan 开场便抛出机器人领域的根本矛盾:" 人类轻松的动作对机器难如登天,这种反直觉的莫拉维克悖论曾让行业停滞数十年。" 他指出了三重突破:
多模态大模型:GPT 系列展现的推理能力与视觉 - 语言 - 动作的跨模态融合,使机器首次具备 " 理解物理世界 " 的基础认知。当机器人能像人类般感知三维空间中的物体关系时,通用性的大门才真正开启。
数据生成革命:通过 GPU 加速仿真技术,过去需要 10 年积累的训练数据如今仅需 3 小时即可生成。英伟达 Omniverse 平台已实现每秒数万次的物理仿真,为机器人构建了指数级进化的训练场。
硬件平民化浪潮:2025 年人形机器人成本已降至 4 万美元,相比 NASA 2001 年 150 万美元的 Robonaut,成本下降 97%。特斯拉 Optimus、Agility Digit 等产品的大规模量产,标志着硬件进入 " 汽车级 " 普及阶段。
-从实验室到现实世界的桥梁
波士顿动力 CTO Aaron Saunders 补充了关键视角:" 过去十年消费电子的溢出效应,让微型传感器、高密度电池等核心部件成本下降 90%。现在一个机器人手掌的算力,已超过 2010 年整台 Atlas 的计算能力。" 他展示的最新 Atlas V3 机器人,其全身分布的 32 个微型摄像头和触觉传感器网络,正是消费电子微型化技术的集大成者。该机型在北极科考测试中,能在 -40 ℃环境下连续工作 8 小时,电池能量密度达到 400Wh/kg,远超特斯拉 4680 电池的 300Wh/kg 水平。
Skild AI 创始人 Deepak Pathak 则从认知维度突破:" 传统机器人依赖工程师编程每个动作,就像教婴儿微积分才能走路。现在我们转向类人的经验学习——让机器通过数亿次试错自主进化运动策略。" 其团队开发的自我监督学习框架,已实现机器人仅凭视觉输入自主掌握复杂地形行走。在 DARPA 挑战赛中,搭载该系统的机器人以 97% 的成功率通过碎石滩、倾斜钢板等极端地形,远超传统控制算法的 63%。
基础模型的爆发式增长:构建通用大脑的范式革命
-简单性与复杂性的哲学统一
Jim Fan 在新增讨论中揭示了基础模型的设计奥秘:"ChatGPT 的成功在于极简主义——将文本到文本的映射统一所有任务。机器人领域需要同样的范式革命。" 他提出的 GR00T 数据金字塔体系包含三个层级:
塔尖:通过远程操作收集的真实物理交互数据(仅占总量 0.1%),如 Agility Robotics 在亚马逊仓库采集的 200 万次搬运动作,涵盖从 3kg 纸箱到 50kg 金属部件的全重量谱系;
中层:基于 Isaac 物理引擎生成的仿真数据(占比 30%),英伟达已实现每秒生成 10 万个机器人跌倒 - 爬起的动态场景,其摩擦系数随机化范围达到 ± 15%;
基座:互联网多模态数据(占比 69.9%),通过视频生成模型预测物理轨迹。例如用 Sora 生成的人形机器人攀岩视频,其力学精度已通过 NASA 验证,轨迹预测误差小于 2 厘米。
-数据多样性的新边疆
1X 创始人 Bernt Bornich 以诗歌训练为例警示:" 单一领域数据训练只会制造 ' 专业白痴 '。我们让 Eve 机器人同时学习擦窗、插花、修理电路,看似无关的任务反而提升其通用性。" 其团队发现,当训练数据包含 30% 的 " 噪音动作 "(如错误抓取后调整)时,策略鲁棒性提升 53%。在家庭环境测试中,Eve 处理突发状况(如宠物干扰)的成功率从 38% 跃升至 82%。
波士顿动力则采取保守策略。Aaron Saunders 透露:"Atlas 的学习数据必须通过安全审查委员会审核,任何可能导致危险动作的场景都会被标记隔离。我们正在开发 ' 安全蒸馏 ' 技术,在保持多样性的同时剔除 0.01% 的高危数据。" 该技术使 Atlas 在建筑工地测试中,工具掉落事故率控制在 0.05 次 / 千小时,接近人类工人的 0.03 次水平。
-人类数据的生物启发
Skild AI 创始人 Deepak Pathak 提出颠覆性观点:"70 亿人类本身就是生物机器人。我们正在构建 ' 神经映射协议 ',将人类运动皮层的电信号转化为机器人控制指令。" 其团队通过脑机接口采集的 1000 小时人体运动数据,使机器人灵巧手抓握精度提升至 0.1 毫米级。在精密装配测试中,机器人成功将直径 0.5mm 的轴承装入微型电机,耗时仅 2.3 秒,超越人类技师的 3.1 秒纪录。
Agility Robotics 的 Pras Velagapudi 补充硬件视角:" 优秀的人形硬件应具备 ' 拟人惯性 ' —— Digit 的关节阻尼曲线完全复刻人体生物力学特征。这使得远程操作员仅需 2 小时就能适应机械身体,实现人机运动映射。" 在仓储场景中,操作员通过 VR 设备控制 Digit 完成货物堆叠,效率达到人工的 1.7 倍,错误率降低至 0.8%。
硬件的阿喀琉斯之踵:规模化生产中的隐秘战争
-个体差异性的终极挑战
Agility Robotics CTO Pras Velagapudi 抛出一个尖锐问题:" 即便同型号机器人,每台的运动学参数都有 0.5% 的天然偏差。当部署量从百台跃升至万台时,这种微观差异会引发系统性崩溃。" 其团队通过 " 数字孪生校准系统 ",为每台 Digit 机器人建立独有动力学档案,使新策略的跨机型迁移成功率提升至 98%。在福特工厂的实测中,100 台 Digit 执行相同装配任务时,动作同步误差小于 0.2 毫米。
波士顿动力则采取不同路径。Aaron Saunders 透露:" 我们为每台 Atlas 配备自诊断模块,实时监测 1500 个机械参数。当检测到关节磨损时,系统会自动调整控制策略补偿性能衰减。" 这种动态适应的能力,使得波士顿动力机器人在北极科考中连续工作 2000 小时后,关节扭矩输出仍能保持设计值的 99.3%。
-开放生态 vs 垂直整合的路线之争
Skild AI 创始人 Deepak Pathak 提出颠覆性观点:" 机器人需要类似 CUDA 的通用中间层。就像 AMD 显卡能运行英伟达代码,不同品牌机器人应共享统一的智能架构。" 其团队开发的 Neurokernel 系统,已在 20 种异构机器人平台上实现策略迁移,验证了 " 通用大脑 " 的可能性。在跨平台测试中,同一抓取算法在工业机械臂、人形机器手、柔性夹爪上的平均成功率差异小于 5%。
1X 创始人 Bernt Bornich 却坚持垂直路线:" 每个机器人都是独特的生命体。我们为 Eve 机器人构建记忆网络,让它持续学习自身机械特性。" 这种个体化学习使 Eve 在 3 个月内将抓取成功率从 52% 提升至 89%,但代价是硬件 - 软件的深度耦合。其专用芯片组的功耗达到 45W,是通用方案的 3 倍。
-物理世界的 " 幻觉 " 难题
关于机器人是否会产生类似 LLM 的 " 幻觉 ",现场爆发激烈争论。Deepak Pathak 坚持 " 物理交互消灭幻觉 ",而 Pras Velagapudi 则以 Agility 机器人的真实事故反驳:" 当 Digit 误判门框高度时,其生成的轨迹就是物理世界的幻觉。" 在物流中心测试中,这种 " 空间错觉 " 导致 2% 的货架碰撞事故。Bernt Bornich 则用幽默案例调和:" 我们的 Eve 机器人曾执着地反复关闭已盖好的马桶圈——这说明它确实产生了对 ' 完美状态 ' 的执念。" 其团队通过引入触觉反馈闭环,将此类误操作率从 15% 降至 1.2%。
未来图景:从工具到伙伴的范式迁移
-3-5 年内的确定性突破
专业机器人爆发:Agility Robotics 已向亚马逊交付 3000 台 Digit 机器人,承担仓库搬运、货架巡检等 12 项任务,效率较人类提升 40%,人力成本降低 57%。
家庭服务革命:1X 的 Eve 机器人开始进入高端家庭,其端茶递物、整理房间的成功率达 91%,月租金降至 999 美元。在东京银座的高端公寓项目中,Eve 的入住率达到 73%。
人机协作范式:英伟达 GR00T 平台支持多机器人协同作业,在宝马工厂实现 "10 台机器人 +1 名监工 " 替代传统 20 人班组,生产节拍时间缩短 22%,缺陷率下降至 0.05%。
-跨实体化的终极挑战
Jim Fan 展示了震撼实验:" 我们让同一 AI 模型同时操控 1000 种形态各异的仿真机器人——从蜘蛛型到蛇型机械体。通过身体标记化技术,模型学会将任意机械结构转化为可理解的参数序列。" 这项名为 MetaMorph 的技术,已实现新机器人策略的零样本迁移,为通用智能奠定基础。在火星地貌模拟测试中,同一算法控制的多形态机器人团队,勘探效率达到单一机型的 3.8 倍。
波士顿动力则从生物拟态突破。Aaron Saunders 透露:" 新版 Atlas 的三指机械手看似倒退,实则暗藏玄机——其触觉反馈频率达 1kHz,能感知 0.1 牛頓的力度变化。人类操作员通过触觉手套,可精确感知机械手抓握鸡蛋的微观形变。" 在生鲜分拣测试中,该机械手成功分拣草莓的成功率达到 99.7%,破损率仅 0.03%。
-十年周期的颠覆性变革
Jim Fan 描绘了震撼蓝图:" 当机器人学会自我复制时,我们将见证指数级进化。就像 AlphaFold 颠覆生物制药,机器人科学家将把药物研发周期从 10 年压缩到 1 年。" 他预测 2035 年前会出现首个自主机器人实验室,能 7 × 24 小时进行百万级实验迭代。在概念验证中,机器人化学家已自主发现 2 种新型催化剂,效率是传统方法的 170 倍。
-社会接受度的隐形门槛
波士顿动力 CTO 发出警示:" 技术成熟度与社会接受度存在代际差。当机器人开始进入养老院照顾老人时,我们需要建立比自动驾驶更严苛的伦理框架。" 其团队正在开发 " 透明决策系统 ",让机器人的每个动作都可追溯解释。在日本养老院试点中,该系统使老人对机器人的信任度从 41% 提升至 79%,但仍有 23% 的受访者表示 " 无法接受机械护理 "。
结语:站在奇点门前的人类抉择
圆桌以 Deepak Pathak 的哲学思考收尾:" 当机器人能 24 小时学习进化时,它们的 ' 童年期 ' 可能比人类缩短 100 倍。我们正在创造一种既像工具又像生命的新物种。" 此刻,技术领袖们达成的最大共识是:机器人革命不是替代人类,而是扩展人类能力的边界。正如 Jim Fan 所说:" 我们这代人注定要回答图灵 83 年前提出的终极命题——当机器获得身体,智能将如何重新定义存在?"
这场对话揭示了一个清晰的技术演进图谱:2025-2028 年是专业机器人规模化落地期,2028-2030 年迎来通用机器人临界点,2030 年后将进入人机共生的深水区。从基础模型的进化到硬件生态的裂变,从数据多样性的探索到社会伦理的重构,这场静默的革命正在重塑人类对智能与存在的终极认知。
登录后才可以发布评论哦
打开小程序可以发布评论哦