太平洋电脑网 02-12
小米开源具身智能VLA模型Xiaomi-Robotics-0,雷军:已布局多年
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【太平洋科技快讯】2 月 12 日消息,雷军今日在社交媒体发文称,小米机器人团队正式开源具身智能 VLA 模型 Xiaomi-Robotics-0。该模型拥有 47 亿参数,采用 MoT 混合架构,以多模态 VLM 大模型为底座,嵌入多层 DiT,使其兼顾通用理解与精细控制。

据介绍,Xiaomi-Robotics-0 在主流的 Libero、Calvin 和 SimplerEnv 测试集,包括所有的 Benchmark 和 30 种模型对比中,均取得当前最优的成绩,且在消费级显卡上实现实时推理。

模型采用跨模态预训练的同时,还保留物体检测、视觉问答等能力。为解决传统 VLA 模型推理延迟导致的 " 动作断层 ",团队采用异步推理模式与 Λ -shape Attention Mask 等机制,使机器人在真实场景中动作连贯、反应灵敏,并在积木拆解、叠毛巾等高难度任务中展现手眼协调能力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

雷军 小米 机器人 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论