豆包打响第一枪，超级Agent和超级APP开战了

豆包手机助手上线后的第三天，在销售渠道 " 火爆 " 的同时，字节在舆论环节已经两度跑出来 " 灭火 "。

这两天，第一批体验用户在使用字节与中兴合作开发的 NubiaM153 时发现，用豆包手机助手代替用户操作 APP 时，先是遇到了 " 微信登录环境异常 "，随后又传出包括淘宝下单被拦截、银行 APP 无法完成支付等情况。

在最新发布的声明里，字节方面解释称，已紧急下线操作微信以及金融、游戏类 APP 的相关能力，并表示将积极与厂商沟通，制定清晰、安全的 AI 操作准则。

此前，字节方面曾强调，NubiaM153 只是一个面向开发者和爱好者的 " 技术预览版 "，目前没有做手机的计划，并且正在和多家厂商洽谈助手合作。

从行业视角看，这是一次 Agent" 新物种 " 与 " 现时代 " 超级 APP 的碰撞：中兴向豆包开放了 INJECT_EVENTS 等系统权限，让 AIAgent 用 " 模拟点击 " 的方式去 " 接管手机 "；而一些平台选择筑高安全栅栏，将豆包的操作在系统中识别为风险行为并拦下。

把视角从豆包身上拉远一点，就会发现这件事更像是一次行业未来变革的当下 " 预演 "：AI 厂商试图借助手机厂商的系统能力、在用户全局视角集中地试图穿透 APP 的边界。

尽管豆包手机助手的能力，目前还不足撼动手机产业格局。但字节在争议中的 " 后撤 "，还是传递出了一些信号。

Agent 在手机上打响 " 入口革命 " 的第一发子弹，已经飞向了构成过去和现在互联网经济基础的超级 APP 们，但这发子弹何时命中，还是个未知数。

过去一年里，手机原生 AI 的节奏明显加快，系统级 Agent 正成为手机行业共同发力的方向。

这条赛道两边，一边是大模型公司和手机厂商，希望用原生 AI 和超级 Agent 重新定义手机——让用户不必再自己打开一个个 APP，直接把任务交给系统层的 Agent。

另一边，是已经牢牢占据用户时间和支付入口的超级 APP。对这些平台而言，APP 不只是一个功能容器，更是时间、交易和数据的入口。

换言之，在手机端原生 AI 的赛道上，要被重新定义的不只是手机，甚至是整个移动互联网的入口生态。

只不过，和头部手机厂商不同，中兴做了一个 " 违背祖制的决定 "，选择在拉入字节作为第三方外援，将手机 OS 部分权限向豆包开放。由此诞生的豆包手机助手，驶入了一片规则尚不明晰、边界尚未划定的 " 无人区 "。

从平台安全视角看，豆包手机助手执行的这种能力和自动化脚本、外挂、批量操作工具一样，在微信、淘宝、银行等涉及金融 / 支付环节的 APP 中，都有可能被识别为一种风险特征。当然，也可以解读为是对 Agent 跨 APP 操作的一种防备。

而针对数据安全问题，字节方面也同步发布了安全白皮书，明确记忆数据优先本地处理并加密存储，不用于模型训练，所有敏感调用需用户授权并保持可见。

对于模拟点击的权限问题，字节方面表示，该权限调用必须经用户主动授权，全程可见且可中断；涉及支付、身份验证等敏感环节时任务会暂停，由用户手动确认。

不过，在没有明确新的规则体系之前，这一套方案的稳定性、合规性，以及是否能够被主流 APP 接纳，都还充满变数。

另一方面，几乎所有头部手机品牌都在加速打造自己的 AI 系统路线：华为在 HarmonyOS 中把小艺升级为系统级智能体，支持全局唤起和部分跨应用任务链；vivo 用蓝心小 V 叠加自研大模型，在 OriginOS5 里承担意图理解和多场景调度；OPPO、小米则通过端云结合、本地 + 云混合的大模型和系统级开放接口，把更多 AI 能力下沉到 OS 层。

这样的背景下，其他头部手机厂商是否愿意把同样的权限共享给豆包，这背后的障碍显然不仅仅是一个技术问题。

不过，对于字节和豆包团队而言，这是一场有预期的 " 激进试水 "。字节方面对外表述一直非常克制：目前展示的只是豆包手机助手的技术预览版，主要面向开发者和行业伙伴体验，不承诺上市时间。

据《蓝鲸新闻》报道披露，NubiaM153 也许不会真正量产，研发中的量产机型要等到 2026 年底之后。这意味着，中兴和字节选择在这个时间节点，把一个尚在 " 实验室阶段 " 的产品提前搬上了真实用户的牌桌，在小范围试水过程中观察边界、收集反馈。

这也解释了为什么整场发布显得异常克制：字节方面反复强调 " 不会造手机 "，似乎也并不想通过这台工程机传递出太多野心。至于中兴，则在这场合作里扮演了一个 " 愿意押注 OS 开放性 " 的伙伴角色，只不过，其他手机厂商是否愿意加入这一合作生态仍是未知。

过去一年，中兴手机在公开场合鲜少提及整体出货和市占排名，行业榜单上基本稳定在 Top10 之外，在一些公开披露的出货量排名中都被归为 "Others"。

此前，曾有媒体披露，NubiaM153 这次首销备货大约 50 万台，不过，字节方面随后回应称这是不实消息。据一些接近字节方面的人士透露，中兴和字节本次合作的 KPI 预期在 3 万台左右。这一数字放在整个手机市场里，只能算是一个非常小样本的测试产品。

不过，发布第一周，豆包手机助手已经用 " 系统级智能体 " 的形式，把 "AI 能不能替代人操作 " 的问题提前抛给了整个行业。未来数年内，这场围绕大模型厂商和移动互联网生态之间交锋，仍将是行业内持续争论的系统性议题。

如果把争议先放在一边，回到这台努比亚 M153 本身，豆包手机助手确实展示出了一些前卫的交互模式，但要想在产品层面改变行业格局仍有一段距离。

NubiaM153 上这套 " 原生 AI" 的基本逻辑，是由中兴在系统层面向豆包 APP 开放部分底层权限，包括模拟点击、前台调度、跨 APP 读写等能力；大部分推理和决策仍由豆包 APP 在后台执行，同时在 UI 上做了一层深度适配。

换言之，豆包手机助手一只脚踏进了系统层，另一只脚还踩在 APP 层。

在实机体验里，这种交互逻辑偶尔也会暴露 " 不那么跟手 " 的一面。最直观的一点是任务无法并行：当豆包正在执行一个链路较长的自动化流程时，如果你尝试中断或插入新的任务，系统会弹出 " 是否终止当前任务 " 的提示，让用户在继续等待和手动接管之间二选一。

效率也是这套机制的一个现实约束。以点外卖为例，在一些实机演示中，用户对手机说 " 帮我点平时那家店的晚餐，照旧就行 "，豆包手机助手会自动打开外卖 APP、进入历史订单、重新下单、确认地址，整个过程并不卡顿，但也需要耗时一分钟以上。

从理解意图到执行指令，豆包执行这个任务的效率算不上慢。但当用户自己上手点单时，以上操作只需不到 30 秒。在这一场景下，在 Z 时代习惯用手机碎片化解决问题的用户眼中，豆包给予的体验也许有些新奇，但是短时间内还难以转化为 " 刚需 "。

但从产业端来看，AI 手机已经是一条没有回头路的轨迹。根据 OPPO 与 IDC 发布的《AI 手机白皮书》，智能手机产业正演化为 " 混合算力为基座、大模型生态在上、智能体和原生 AI 服务构筑应用 " 的新生态。

未来的智能手机中，OS 和硬件更像是承载大模型和智能体的 " 壳 "，而非单纯的任务调度器。Counterpoint 的此前报告显示：2025 年，具备 GenAI 能力的手机 SoC 将占出货量的约 35%，且高阶平台的峰值 AI 算力将突破 100TOPS。

而不甘于在 "Others" 阵营的中兴，自然也乐于借助豆包的力量加速驶入这个赛道，成为把原生 Agent 跑到实机上的厂商之一。

在手机之外，原生 AI 助手出现，也让字节的硬件生态布局看到了新前景。豆包手机助手官网上，专门提到支持自家 OlaFriend 耳机进行交互。某种程度上来看，这类 " 脱手感 " 在可穿戴场景里，AI 助手的便捷性会被进一步放大。

所以，眼下的豆包手机助手，不管是实机演示的效果，还是合作厂商中兴的出货实力，短期内都难以成为行业威胁。但在过去一周中，豆包和努比亚已经证明了一件事：如果智能体和 OS 走得足够近，手机（原生手机助手）确实有变成下一代超级入口的可能。

友商们真正值得紧张的，也许不是这台工程机本身，而是由它开启的这场关于 " 入口 " 的重新洗牌。

如果把豆包手机助手拉回到更大的坐标里，它所代表的意义已然十分清晰：这是一次把 "AI 智能体 " 往 " 下一代入口 " 方向推的试探，试图撼动整个眼下由超级 APP 牢牢占据的移动互联网格局。

先看今天的互联网用户结构。QuestMobile 年度报告显示，截至 2024 年底，中国移动互联网全网月活用户规模达到 12.57 亿人，整体月人均使用时长已经攀升至 171.7 小时。

其中短视频、即时通讯、综合资讯三大类应用占去了最大的时间份额——短视频月人均使用时长 62.9 小时，即时通讯 40.2 小时，综合资讯 24.4 小时，同比仍在增长。

换句话说，大部分人的手机时间，已经被 "KillTime" 型内容彻底锁死。微信在其中扮演的是一种 " 操作系统式 " 的角色：既承担即时通讯，又承载支付、小程序、公众号、视频号等服务，构成了一个从社交到服务的复合入口。

腾讯 2025 年一季度财报显示，微信的月活跃账户数已达到约 14 亿。这个体量，意味着任何试图在系统层 " 代替用户操作微信 " 的方案，都会被当作对现有秩序的潜在冲击。

另一方面，进入 AI 时代后，过去 10 年的互联网方法论似乎出现了变量，原生 AI APP 能交互、能搜索信息、能完成文字 / 代码层面的任务、还能借助多模态能力渗透到更多场景。

在豆包 " 上机 " 之前，豆包 APP 已经是中国原生 AI 最火爆的产品，8 月以来反超 DeepSeek 占据行业榜首。腾讯一边推进混元大模型和元宝 APP，一边在微信视频号、电商和轻量 AI 助手之间寻找新的平衡。就在最近，阿里也赶在 2026 年之前推出 " 千问 "APP、公测一周下载量过千万，同时发布全模态通用助手 " 灵光 "。

不过，APP 形态本身也成为了 AI 能力的封印，使其很难真正贴近用户的高频交互和真实场景。想要让 Agent 介入生活运行的每一个细枝末节，它最终必须与物理终端深度结合，更主动的拥抱用户响应需求。

这也解释了为何在打造原生 AI 超级 APP 的同时，字节选择了与手机厂商合作。当豆包的同一套能力变成系统级助手，用户可以在使用手机时随时调用 AI 能力，在决策层就让 Agent 介入自动跑通处理。

对超级 APP 而言，这种变化的危险之处，一方面在于支付等场景的合规风险，同时也在于它可能把平台辛苦建立的用户生态，丢给了一个站在系统层之上的智能体。

以微信为例，AI 赋能提效是大势所趋，但前提是不能打乱囊括了视频号、公众号、小程序、企业微信、支付、理财的庞大生态矩阵。对于微信而言，最理想的形态是依托自家元宝针对微信场景定制的 AIAgent 能力，而不是把入口交给一个来自竞争对手体系的豆包。

与此同时，腾讯也在用自己的方式布局这条赛道。一方面，混元大模型持续升级，并通过微信小程序、企业微信、C 端 AI 助手元宝等产品渗透到不同场景；另一方面，微信自己也在尝试把 AI 嵌入搜索、内容分发和广告系统中，让 AI 能力成为 " 增强入口 " 的工具，而不是替代入口的新层级。

这一系列头部企业新老业态间的交锋，在过去几天中被进一步放大：一边是字节希望把豆包从 APP 里 " 抬 " 到更高的入口层级，另一边则是微信、银行 APP 用现有风控体系给这只 " 新手 " 画条边界线。

从更长周期看，随着手机产业硬件和算力的演进，这一类交锋已然不可避免。Counterpoint 等机构预测，到 2027 年具备生成式 AI 能力的手机渗透率有望达到 40% – 45%，前提是 SoC 的 NPU 性能和端侧大模型能力持续提升。

在这样的轨迹上，原生手机助手的迭代仍会持续加速，NubiaM153 和它上面的豆包手机助手，更像是 Agent 时代起点处的一个可能很快就会杂草淹没或者被路人踩倒的小标示牌，它的价值，需要等待时间的再发掘，毕竟，就像开头所说，子弹何时射中眉心，谁也不知道。

宙世代

一起剪

相关标签