AI眼镜，烈火烹油下的冷思考

AI 眼镜不仅要让大模型，也要让人同时具备观察世界的能力。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

文｜游勇

‍‍‍‍‍‍

编｜周路平

比六月的热浪更加滚烫的，估计只有 AI 眼镜了。

整个六月，AI 眼镜已经成为全行业瞩目的硬件品类。小米在这个月发布了 AI 眼镜，掀起了全行业的关注和讨论，给这个新品类添了一把火；那个卖出 200 万台 AI 眼镜的 Meta 又与眼镜品牌 Oakley 推出了面向运动市场的 AI 眼镜；而苹果的 AI 眼镜路线图也被首次曝光。

除了这些大厂的动作，AR 领域专业品牌 Rokid 也在为这个行业加了一捆柴。尽管 Rokid 的首台 AI 眼镜 Rokid Glasses 已经下产线，首批 F 码用户也已经收到货，但 25 万台的预售量，依然是 Rokid 甜蜜的烦恼。在 Rokid 多个官方账号下面，每更新一条内容，评论区就会涌入大量催发货的用户。

这种甜蜜烦恼的背后，是 AI 眼镜已经迎来风口，无论是厂商竞争还是用户热情，都在一浪接着一浪。

有数据预测，预计 2025 年，全球 AI 智能眼镜销量达到 550 万台，成为下一代现象级的交互终端。如今，市场玩家们野心勃勃，整个行业都在烈火烹油。

爆火背后，一场交互革命

AI 眼镜受追捧背后，一场人机交互的革命正在席卷而来。

从最近的几款明星产品能看到，拍摄第一人称视角的照片和视频是最多人体验的功能。以前大家都是举着手机或者相机去拍摄，但很多场景需要解放双手，比如骑行、聚会抓拍等。

除了拍摄第一人称视角的照片和视频，当我们在海外旅行时，语言常常是需要克服的难关，以前需要借助手机翻译软件或者是专门的随身翻译器，一句一句给对方看。

但现在可以戴着 AI 眼镜去交流，翻译的内容通过语音播报或者实时显示在屏幕上，无论是在餐馆点餐或者看路边指示牌，都不用担心语言不通带来的出行障碍。

类似的场景还有很多。央视记者曾用 Rokid Glasses 尝试过这样的一个场景，在新闻采访时，很多受访者在硕大的镜头前会感到紧张不适，但换成眼镜，很多人往往会忽略掉这么一个小小的设备，不仅受访者更轻松自然，采访的效果也更佳。

AI 能力的突破也是 AI 眼镜受热捧的一个关键。过往的一些智能眼镜类产品，更像是视频眼镜，更多是记录拍摄，很难真正与现实世界做交互。

大模型带来的 AI 能力提升，彻底改变了这种体验。比如当你戴着 AI 眼镜，问眼前的水果摊，应该选择哪个榴莲，AI 视觉会根据榴莲的外观给出答案。

当你看到不认识的动植物，AI 眼镜可以告诉你答案。

甚至在便利店购物时，别人都需要掏出手机，打开支付宝，点开二维码，而你只需要用眼镜看一下，然后说一声确认支付，就能完成支付的体验，旁边人都愣在了原地，而你潇洒离去。

不少拿到机器的用户也在探索更多使用的可能。比如不少家长在辅导孩子作业时经常鸡飞狗跳，而戴着 AI 眼镜可以识别题目，并且 AI 会给出解题步骤和答案，这对很多家长也是个福音。

不难发现，一副只有 50g 左右的眼镜，轻度应用五六个小时的续航，能随时应答通过 AI 给你帮助，能拍摄第一视角的照片和视频，当这些元素汇集到一起时，最终造就了一个爆款品类。

在 20 年前的功能机时代，人们通过按键来交互；到 10 年前的智能机时代，触控式交互带来了体验上的革命性变化。如今，随着语音和视觉交互的逐渐成熟，新一代的交互终端也在一步步逼近现实。

AI 眼镜，要不要带显示？

目前，行业内的玩家大致可以根据产品分为几种类型：一是像 Meta 雷朋和小米采用的不带显示但带有摄像头的方案，二是带显示但没有摄像头的方案，三是 Rokid Glasses 这类采用 AI+AR 的方案，既有摄像头感知物理世界，又有 AR 显示给用户提供更多的信息交互。

没有显示的方案，可以把成本和功耗做得更低，但也带来了局限和弊端，包括体验不连贯、场景有限等。

以日常使用频率最高的拍照和拍视频为例，因为没有显示，用户很难知道当前画面是正的还是歪的。而现在的光波导方案，虽然不会直接在眼睛上呈现最终的拍摄效果，但可以让用户很清晰地知道视觉的中心位置，避免拍歪的情况。

业内看来，不带显示的 AI 眼镜更像是行业发展初期的折中方案。它在现阶段，节省了成本、提高了续航，同时也降低产品的量产难度。

但外界普遍认为未来会向 AI+AR 的方向演进，AR 为 AI 提供虚实融合的显示载体。换句话说，让 AI 看得见才是好 AI，才更能适应多场景的使用需要。

事实上，上述提到的很多 AI 眼镜的使用场景都在指向一点，要想让 AI 在物理世界有更好的体验，光有语音交互是不够的，很多场景依然离不开 AI 与 AR 的结合。

比如 Rokid 与高德地图最新推出的基于智能眼镜的导航智能体（NaviAgent），能看到显示在应用场景中的价值。相比于简单的语音播报，AR 可以呈现更多关键信息，包括贴地引导线和场景化转向立牌，让用户在复杂环境中也能轻松找到方向。

比如同样是同声传译的功能，不带显示的 AI 眼镜，只能依赖语音播报，接收信息的效率低，而且容易受到外界干扰，如果有路人搭话或者手机铃声响起，都会打断交互过程，体验不佳。

AR 显示的方案，则可以把这些信息呈现在眼前，无需等待语音读完。众所周知，眼睛获取信息的效率远高于耳朵，人类 80% 以上的信息获取来自视觉。

今年年初，Rokid CEO 祝铭明的一段演讲视频走红，当时他就佩戴 Rokid Glasses 实现了脱稿演讲。对于他这类社恐人群，带有显示的 AI 眼镜既避免了念稿的生硬，又完全不用担心紧张忘词，演讲内容能在外界不易察觉的情况下悬浮在眼前。

显然，演讲提词的功能是目前不带显示的 AI 眼镜没有办法实现的。不久前，央视主持人也专门体验了 Rokid Glasses 的这一功能，甚至 AI 的语音识别系统能捕捉演讲者语速变化，当突然加速、刻意放缓甚至跳读，文本滚动都能实现无缝同步，整个流程非常丝滑。

"AR 显示功能，我们认为是非常重要的一个部分。相当于这款 AI 眼镜让人和大模型同时具备了观察世界的能力。"Rokid 副总裁王俊杰说，但这几个功能叠加，对产品研发和量产的难度，会大幅提升。

不过，目前 AI 眼镜的显示空间还比较小，在特定角度也会出现绿光。但在业内看来，随着光机越做越小，显示区域越做越大，会有可能实现更多的应用场景。

之前就有用户用 Rokid Glasses 制作过一个打麻将的视频，它可以记录每个人出的牌，然后用 AI 计算每张牌点炮的概率。虽然这是后期渲染的视频，但也给外界提供了有趣而庞大的想象空间。

随着未来与更多软硬件生态的打通，AI+AR 的交互体验将更加丰富，而看得见的 AI 也会比单纯的 AI 语音助手，提供更加舒适多彩的体验。

产能之外，还有哪些难题待解

尽管市场热闹，但业内普遍的观点是，AI 眼镜还在初级阶段。一个最直观的感受是，随着用户热情的高涨，AI 眼镜的产能遇到了不小的挑战。

相比于手机等成熟的电子产品，AI 眼镜作为一个全新的品类，面临着产业链爬坡的难题。去年年底开始，行业掀起了百镜大战，数十家厂商陆续发布了 AI 眼镜，但真正量产上市的产品并不多，很多还处于 PPT 阶段。

这也意味着，无论是产品成熟度，还是供应链的能力，AI 眼镜都还有很多的课要补。

Rokid Glasses 在发布后就一直关注度很高，祝铭明直言压力大。尤其相比于不带显示的 AI 眼镜，Rokid Glasses 这类具备光波导功能的 AI+AR 的眼镜，无论是工艺，还是量产的难度都会更高。

除了产能的困扰，AI 眼镜作为新事物，产品本身的体验，也可能与用户的预期存在一些偏差。

比如视频抖动，尽管现在的产品都加入了 AI 防抖算法，但毕竟戴在头上，抖动很难避免，尤其是夜间光线差的环境下，这个问题会更明显。不过，从用户的实际体验来看，AI 眼镜拍摄的照片和视频用来发朋友圈完全够用。

另外，续航一向是 AI 眼镜，甚至是所有 XR 设备都焦虑和困扰的难题。一方面眼镜要求尽可能地轻量化，实现长时间佩戴；但另一方面，不到 50g 的体积意味着很难放下高容量的电池，续航的矛盾会长期存在。

目前，包括 Meta 的产品在内，普遍只能做到连续录像一小时左右的时长。而镜片带光波导显示的产品，更是增加了耗电量。

不过，业内已经在想方设法增加产品的续航时间，比如配备可充电的眼镜盒。Rokid 甚至还推出了胶囊电池。这个不到 10g 的胶囊形状电池，可以直接磁吸在镜腿上，既不会带来太大负担，也不会影响美观。而胶囊电池的续航能力将提升至原有水平的三倍，在直播等高耗电场景也可以延长 2-3 小时的续航时间。

还有一大难题是 AI 眼镜的算力有限，目前基本依赖云端大模型。不少用户反馈市面上的一些 AI 眼镜的 AI 能力表现不佳，比如在对话时，AI 助手反应不及时，或者对物体的识别不准确等，而用户也不能去调用市面上成熟的大模型产品。

这对于不少 AI 眼镜的创业型公司反而不是困扰，因为不涉及基础模型的开发，开放与第三方大模型的合作，反而能给用户提供更多元的选择。

比如 Rokid Glasses 的设置界面，就提供了包括通义千问、豆包、DeepSeek、智谱在内的多种大模型，用户可以设置不同的基础模型和视觉模型，保证了不同的任务能够输出最佳的效果。而且，AI 输出的内容在眼镜端进行了优化，并不会长篇大论，只会显示最核心的信息和结论。

另外，AI 眼镜也面临着隐私安全、应用生态不完善等问题。总之，市场的热闹在推动着行业走向成熟，但无论是厂商还是用户，都应该对行业的现状有着更清醒的认知。

客观说，任何革命性意义的产品早期都存在很多的不足，从电脑到智能手机，都经历了长期的迭代和演进，最终一步步走向成熟。这也意味着，需要用户给予更多的包容。

AI 眼镜的能力其实一直在加速迭代，比如祝铭明在年初爆火的演讲中，翻页还依赖指环，但交付的产品已经实现了 AI 的智能提词和翻页。

过去十年，XR 经历了多轮起伏，随着这些年 AI 能力的融入和产品轻量化的改进，行业再一次被寄予厚望，至少让外界看到了 AI 眼镜不仅仅是极客或者尝鲜者的玩具，而是能够真正在现实生活中，给人们带来便利和酷炫体验。

进群、转载或商务合作联系后台

文章精选

宙世代

一起剪

相关标签