数智前线 16小时前
AI眼镜,烈火烹油下的冷思考
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 眼镜不仅要让大模型,也要让人同时具备观察世界的能力。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

文|游勇

‍‍‍‍‍‍

编|周路平

比六月的热浪更加滚烫的,估计只有 AI 眼镜了。

整个六月,AI 眼镜已经成为全行业瞩目的硬件品类。小米在这个月发布了 AI 眼镜,掀起了全行业的关注和讨论,给这个新品类添了一把火;那个卖出 200 万台 AI 眼镜的 Meta 又与眼镜品牌 Oakley 推出了面向运动市场的 AI 眼镜;而苹果的 AI 眼镜路线图也被首次曝光。

除了这些大厂的动作,AR 领域专业品牌 Rokid 也在为这个行业加了一捆柴。尽管 Rokid 的首台 AI 眼镜 Rokid Glasses 已经下产线,首批 F 码用户也已经收到货,但 25 万台的预售量,依然是 Rokid 甜蜜的烦恼。在 Rokid 多个官方账号下面,每更新一条内容,评论区就会涌入大量催发货的用户。

这种甜蜜烦恼的背后,是 AI 眼镜已经迎来风口,无论是厂商竞争还是用户热情,都在一浪接着一浪。

有数据预测,预计 2025 年,全球 AI 智能眼镜销量达到 550 万台,成为下一代现象级的交互终端。如今,市场玩家们野心勃勃,整个行业都在烈火烹油。

爆火背后,一场交互革命

AI 眼镜受追捧背后,一场人机交互的革命正在席卷而来。

从最近的几款明星产品能看到,拍摄第一人称视角的照片和视频是最多人体验的功能。以前大家都是举着手机或者相机去拍摄,但很多场景需要解放双手,比如骑行、聚会抓拍等。

除了拍摄第一人称视角的照片和视频,当我们在海外旅行时,语言常常是需要克服的难关,以前需要借助手机翻译软件或者是专门的随身翻译器,一句一句给对方看。

但现在可以戴着 AI 眼镜去交流,翻译的内容通过语音播报或者实时显示在屏幕上,无论是在餐馆点餐或者看路边指示牌,都不用担心语言不通带来的出行障碍。

类似的场景还有很多。央视记者曾用 Rokid Glasses 尝试过这样的一个场景,在新闻采访时,很多受访者在硕大的镜头前会感到紧张不适,但换成眼镜,很多人往往会忽略掉这么一个小小的设备,不仅受访者更轻松自然,采访的效果也更佳。

AI 能力的突破也是 AI 眼镜受热捧的一个关键。过往的一些智能眼镜类产品,更像是视频眼镜,更多是记录拍摄,很难真正与现实世界做交互。

大模型带来的 AI 能力提升,彻底改变了这种体验。比如当你戴着 AI 眼镜,问眼前的水果摊,应该选择哪个榴莲,AI 视觉会根据榴莲的外观给出答案。

当你看到不认识的动植物,AI 眼镜可以告诉你答案。

甚至在便利店购物时,别人都需要掏出手机,打开支付宝,点开二维码,而你只需要用眼镜看一下,然后说一声确认支付,就能完成支付的体验,旁边人都愣在了原地,而你潇洒离去。

不少拿到机器的用户也在探索更多使用的可能。比如不少家长在辅导孩子作业时经常鸡飞狗跳,而戴着 AI 眼镜可以识别题目,并且 AI 会给出解题步骤和答案,这对很多家长也是个福音。

不难发现,一副只有 50g 左右的眼镜,轻度应用五六个小时的续航,能随时应答通过 AI 给你帮助,能拍摄第一视角的照片和视频,当这些元素汇集到一起时,最终造就了一个爆款品类。

在 20 年前的功能机时代,人们通过按键来交互;到 10 年前的智能机时代,触控式交互带来了体验上的革命性变化。如今,随着语音和视觉交互的逐渐成熟,新一代的交互终端也在一步步逼近现实。

AI 眼镜,要不要带显示?

目前,行业内的玩家大致可以根据产品分为几种类型:一是像 Meta 雷朋和小米采用的不带显示但带有摄像头的方案,二是带显示但没有摄像头的方案,三是 Rokid Glasses 这类采用 AI+AR 的方案,既有摄像头感知物理世界,又有 AR 显示给用户提供更多的信息交互。

没有显示的方案,可以把成本和功耗做得更低,但也带来了局限和弊端,包括体验不连贯、场景有限等。

以日常使用频率最高的拍照和拍视频为例,因为没有显示,用户很难知道当前画面是正的还是歪的。而现在的光波导方案,虽然不会直接在眼睛上呈现最终的拍摄效果,但可以让用户很清晰地知道视觉的中心位置,避免拍歪的情况。

业内看来,不带显示的 AI 眼镜更像是行业发展初期的折中方案。它在现阶段,节省了成本、提高了续航,同时也降低产品的量产难度。

但外界普遍认为未来会向 AI+AR 的方向演进,AR 为 AI 提供虚实融合的显示载体。换句话说,让 AI 看得见才是好 AI,才更能适应多场景的使用需要。

事实上,上述提到的很多 AI 眼镜的使用场景都在指向一点,要想让 AI 在物理世界有更好的体验,光有语音交互是不够的,很多场景依然离不开 AI 与 AR 的结合。

比如 Rokid 与高德地图最新推出的基于智能眼镜的导航智能体(NaviAgent),能看到显示在应用场景中的价值。相比于简单的语音播报,AR 可以呈现更多关键信息,包括贴地引导线和场景化转向立牌,让用户在复杂环境中也能轻松找到方向。

比如同样是同声传译的功能,不带显示的 AI 眼镜,只能依赖语音播报,接收信息的效率低,而且容易受到外界干扰,如果有路人搭话或者手机铃声响起,都会打断交互过程,体验不佳。

AR 显示的方案,则可以把这些信息呈现在眼前,无需等待语音读完。众所周知,眼睛获取信息的效率远高于耳朵,人类 80% 以上的信息获取来自视觉。

今年年初,Rokid CEO 祝铭明的一段演讲视频走红,当时他就佩戴 Rokid Glasses 实现了脱稿演讲。对于他这类社恐人群,带有显示的 AI 眼镜既避免了念稿的生硬,又完全不用担心紧张忘词,演讲内容能在外界不易察觉的情况下悬浮在眼前。

显然,演讲提词的功能是目前不带显示的 AI 眼镜没有办法实现的。不久前,央视主持人也专门体验了 Rokid Glasses 的这一功能,甚至 AI 的语音识别系统能捕捉演讲者语速变化,当突然加速、刻意放缓甚至跳读,文本滚动都能实现无缝同步,整个流程非常丝滑。

"AR 显示功能,我们认为是非常重要的一个部分。相当于这款 AI 眼镜让人和大模型同时具备了观察世界的能力。"Rokid 副总裁王俊杰说,但这几个功能叠加,对产品研发和量产的难度,会大幅提升。

不过,目前 AI 眼镜的显示空间还比较小,在特定角度也会出现绿光。但在业内看来,随着光机越做越小,显示区域越做越大,会有可能实现更多的应用场景。

之前就有用户用 Rokid Glasses 制作过一个打麻将的视频,它可以记录每个人出的牌,然后用 AI 计算每张牌点炮的概率。虽然这是后期渲染的视频,但也给外界提供了有趣而庞大的想象空间。

随着未来与更多软硬件生态的打通,AI+AR 的交互体验将更加丰富,而看得见的 AI 也会比单纯的 AI 语音助手,提供更加舒适多彩的体验。

产能之外,还有哪些难题待解

尽管市场热闹,但业内普遍的观点是,AI 眼镜还在初级阶段。一个最直观的感受是,随着用户热情的高涨,AI 眼镜的产能遇到了不小的挑战。

相比于手机等成熟的电子产品,AI 眼镜作为一个全新的品类,面临着产业链爬坡的难题。去年年底开始,行业掀起了百镜大战,数十家厂商陆续发布了 AI 眼镜,但真正量产上市的产品并不多,很多还处于 PPT 阶段。

这也意味着,无论是产品成熟度,还是供应链的能力,AI 眼镜都还有很多的课要补。

Rokid Glasses 在发布后就一直关注度很高,祝铭明直言压力大。尤其相比于不带显示的 AI 眼镜,Rokid Glasses 这类具备光波导功能的 AI+AR 的眼镜,无论是工艺,还是量产的难度都会更高。

除了产能的困扰,AI 眼镜作为新事物,产品本身的体验,也可能与用户的预期存在一些偏差。

比如视频抖动,尽管现在的产品都加入了 AI 防抖算法,但毕竟戴在头上,抖动很难避免,尤其是夜间光线差的环境下,这个问题会更明显。不过,从用户的实际体验来看,AI 眼镜拍摄的照片和视频用来发朋友圈完全够用。

另外,续航一向是 AI 眼镜,甚至是所有 XR 设备都焦虑和困扰的难题。一方面眼镜要求尽可能地轻量化,实现长时间佩戴;但另一方面,不到 50g 的体积意味着很难放下高容量的电池,续航的矛盾会长期存在。

目前,包括 Meta 的产品在内,普遍只能做到连续录像一小时左右的时长。而镜片带光波导显示的产品,更是增加了耗电量。

不过,业内已经在想方设法增加产品的续航时间,比如配备可充电的眼镜盒。Rokid 甚至还推出了胶囊电池。这个不到 10g 的胶囊形状电池,可以直接磁吸在镜腿上,既不会带来太大负担,也不会影响美观。而胶囊电池的续航能力将提升至原有水平的三倍,在直播等高耗电场景也可以延长 2-3 小时的续航时间。

还有一大难题是 AI 眼镜的算力有限,目前基本依赖云端大模型。不少用户反馈市面上的一些 AI 眼镜的 AI 能力表现不佳,比如在对话时,AI 助手反应不及时,或者对物体的识别不准确等,而用户也不能去调用市面上成熟的大模型产品。

这对于不少 AI 眼镜的创业型公司反而不是困扰,因为不涉及基础模型的开发,开放与第三方大模型的合作,反而能给用户提供更多元的选择。

比如 Rokid Glasses 的设置界面,就提供了包括通义千问、豆包、DeepSeek、智谱在内的多种大模型,用户可以设置不同的基础模型和视觉模型,保证了不同的任务能够输出最佳的效果。而且,AI 输出的内容在眼镜端进行了优化,并不会长篇大论,只会显示最核心的信息和结论。

另外,AI 眼镜也面临着隐私安全、应用生态不完善等问题。总之,市场的热闹在推动着行业走向成熟,但无论是厂商还是用户,都应该对行业的现状有着更清醒的认知。

客观说,任何革命性意义的产品早期都存在很多的不足,从电脑到智能手机,都经历了长期的迭代和演进,最终一步步走向成熟。这也意味着,需要用户给予更多的包容。

AI 眼镜的能力其实一直在加速迭代,比如祝铭明在年初爆火的演讲中,翻页还依赖指环,但交付的产品已经实现了 AI 的智能提词和翻页。

过去十年,XR 经历了多轮起伏,随着这些年 AI 能力的融入和产品轻量化的改进,行业再一次被寄予厚望,至少让外界看到了 AI 眼镜不仅仅是极客或者尝鲜者的玩具,而是能够真正在现实生活中,给人们带来便利和酷炫体验。

© 本文为数智前线(szqx1991)原创内容

进群、转载或商务合作联系后台

文章精选

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 智能眼镜 翻译 ar 央视
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论