网通社汽车频道 05-13
小米发布XiaomiOneVL自动驾驶框架并开源代码
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

小米近日发布 XiaomiOneVL,该框架为一步式潜空间语言视觉推理系统,首次在行业内统一了视觉语言动作模型(VLA)、世界模型和潜空间推理等技术路线。XiaomiOneVL 通过 " 语言推理 + 视觉未来预测 " 的双重监督机制,将可解释性与对未来场景的预测能力整合进潜空间推理过程,在推理精度上超越显式思维链(CoT)方法,同时在推理速度上与仅输出答案的潜空间 CoT 方案相当。 该框架基于三项关键技术:模型使用 " 内部语言 " 进行思考、具备预测未来画面的能力、并将整个推理过程压缩至单步完成,旨在提升自动驾驶系统对当前场景及未来时空因果关系的理解能力,以支持更高质量的决策。 小米已全面开源 XiaomiOneVL 的模型权重及训练、推理代码,向全球开发者和研究人员开放,以促进自动驾驶大模型的技术迭代与发展。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小米 自动驾驶 开源 自动驾驶系统
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论