盖世汽车讯 据外媒报道,谷歌 DeepMind 宣布推出两款用于控制机器人的新型人工智能模型:Gemini Robotics 和 Gemini Robotics-ER。该公司声称,这些模型将帮助各种形状和大小的机器人更有效、更细致地理解世界,并与物理世界互动,为人形机器人助手等应用铺平道路。
图片来源:DeepMind
值得注意的是,尽管机器人平台的硬件在稳步发展,但创建一个能够安全、精确地自主驾驶这些机器人穿越新场景的人工智能模型却难以实现。
为此,谷歌的新模型基于其 Gemini 2.0 大型语言模型建立,增加了专门用于机器人应用的功能。Gemini Robotics 包括谷歌所谓的 " 视觉 - 语言 - 动作 "(VLA)能力,使其能够处理视觉信息、理解语言命令并产生身体动作。相比之下,Gemini Robotics-ER 专注于 " 具身推理(embodied reasoning)",增强了空间理解能力,让机器人专家将其连接到现有的机器人控制系统。
登录后才可以发布评论哦
打开小程序可以发布评论哦