雷锋网 8小时前
Manus走了,原生Agent登场:“AI助手”的第三次重新定义
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

回顾过去十几年,市场对 "AI 助手 " 的想象经历过三次大规模的预期校准。

第一次是   Siri   诞生时,语音控制带来了交互的新鲜感,人们以为电影里的智能管家   Jarvis   就在眼前,但随后发现它更多时候只是一个语音闹钟;

第二次是   ChatGPT   横空出世,流畅的对话与推理能力让人觉得   AI   终于有了 " 脑子 ",但很快市场意识到,它依然只是一个在对话框里坐而论道的智者,看不到对话框之外的世界。

2025   年初,Manus   的出现,让   Agent   的概念有了实感。这一次的冲击不同以往——很多人第一次看到   AI   不仅在 " 说 ",而且在 " 做 "。它当着你的面打开浏览器、编写代码、调试错误、甚至因为网页加载太慢而主动刷新。

当   Manus   的热度随着被收购而逐渐平息,人们才发现,无论技术外壳如何变迁,人类对   AI 助手的核心渴望从未改变:用户不只想要一个仅仅能听懂话的陪聊,也不只想要一个会在黑底白字界面里写代码的极客工具;大家想要的,一直都是一个更聪明、真正能把活儿干完的帮手。

随着   Manus   完成它的历史使命,Agent   的下半场大幕正在拉开。

01

Manus   完成了它的历史使命:Agent   的启蒙运动

作为一家公司,Manus   的最终归宿或许存在争议;但作为一个产品现象,Manus   已经完成了它的历史使命——它是   Agent   时代的启蒙者。

在   Manus   之前,Agent   更多停留在学术论文和极客的   Python   脚本里。Manus   的成功之处在于,它通过可视化的交互,第一次向普通用户展示了   Claude   模型背后潜藏的   Agent   能力。它把 " 拆解任务 - 自主执行 - 环境反馈 - 修正路径 " 这一整套复杂的黑盒逻辑,变成了一个让用户盯着屏幕看的直观过程。

Manus   与   Claude   模型是典型的 " 互相成就 "。Claude   稳定的计算机使用(Computer Use)能力、代码能力、工具调用能力是地基,而   Manus   是那座拔地而起的样板房。Manus   的流行,本质上是   Anthropic   技术愿景在应用层的一次成功落地。

然而,Anthropic   自家产品   Claude Code   的持续破圈,影响力逐渐从技术圈外溢,也揭示了一个道理:Agent   的天花板,依然由底层大模型决定。

当应用层的交互红利被吃透后,竞争会回归到模型本身。Manus   展示了 " 过程 ",但受限于模型对虚拟环境的适配度、API   成本和推理稳定性,它依然难以成为大家日常工作的依赖。与此同时,国内外的其他基模创业公司——无论是   OpenAI   还是国内的 DeepSeek、Kimi ——都已将 Agent 作为发力方向:通过把   Agent   能力直接 " 内化 " 进模型里。

但这并不意味着第三方   Agent   创业者的末日,一个更有价值的方向已经浮出水面:基于独有知识库的深度 Agent。当通用执行力被第一方产品 " 内化 " 成模型能力时,第三方   Agent   的核心竞争力就从 " 执行力 " 转向了 " 信息不对称 "。

最典型的例子是金融研报   Agent。一个能够调取过去二十年、数百万份非公开独家研报数据库,并能根据这些高价值信息进行分析的   Agent,其价值远超一个只能翻翻网页的通用工具。在法律、医疗、审计等垂直领域,这种基于 " 孤岛数据 " 构建的   Agent   产品,才是第三方厂商真正能守住的护城河。

现在,行业正处于一个微妙的瓶颈期:基模的   Agent   能力在飞速提升,不同的基模厂商会有各自希望重点突出的   Agent   能力侧重点,但在产品形态上,大多数厂商还在摸索,试图找到让这些能力真正渗透进普通人日常工作流的路径。

02

Agent   的 "iPhone 时刻 ":从炫技到日常

所有现在的   AI   助手,终将进化为   Agent。这已是行业共识。

如果说   2025   年是   Agent   的 " 功能机时代 " ——大家还在比拼谁能多轮联网搜索、谁调用的工具多;那么   2026   年,行业正在呼唤   Agent   的 "iPhone   时刻 "。这场战争的决胜点在于两端:一端是模型原生   Agent   能力的硬核比拼,另一端是产品设计的范式革命。

在国内的赛场上,这种角逐尤为激烈。

最早嗅到这一气息并拿到 " 入场券 " 的,是   Kimi。判断一个产品是否切中刚需,有一个极具中国特色的指标—— " 闲鱼认证 "。在   Kimi   在 25 年 6 月上线 " 深度研究 " 功能,由于免费用户能使用的次数有限,闲鱼上出现了大量倒卖付费会员次数和代跑服务的现象。这种 " 求而不得 ",验证了用户对于 "AI   帮我做完一件事 " 的真实渴望。

随后的故事不仅发生在应用层。Kimi   推出的   K2   模型,是国内较早旗帜鲜明主打   Agentic   能力的基座模型。这直接催生了   Kimi   的通用   Agent   模式。与传统的 " 聊天框 " 不同,Kimi   的   Agent   模式更像是想要打造一个全栈能力的虚拟工作环境。通过   Agent   模式,Kimi   尝试打破 " 对话 " 的边界:从处理百万行   Excel   数据到生成复杂的   PPT,它不再是 " 聊完即走 ",而是像人类一样,从列计划、做调研开始,一步一步去完成一个项目。

2025   年双   11   期间,随着   Kimi   编程套餐的上线,他们也推出了   Kimi CLI   工具。这是一款在命令行里运行的   Agent,与   Anthropic   的   Claude Code   类似,专门服务于开发者的代码场景,但也开始外溢到非技术人员的非编码工作场景。

与此同时,国内战局并未大定。DeepSeek   新模型主打的重点是   Agent   能力。智谱选择了一条差异化的路径,他们开源了   Phone Use   模型。这个模型更侧重于通过视觉识别,像人手一样去操作现有的手机 App   界面……

03

聊天时代结束,中国的 Anthropic 竞赛开始

ChatGPT   开启的   Chat   时代也正在落幕。

未来的   AI   助手,衡量标准将变得非常务实:能不能帮我定位这个线上   Bug,自行搜索解决方案,写好修复代码,跑通测试,并把补丁推上线?能不能帮我整理完这   200   份财报并画出图表?能不能帮我把本周   5   场产品评审会的录音听完,整理出所有需求变更点,同步更新到   PRD   文档,并自动在项目管理软件里创建好对应的开发任务?

在这场从 " 聊 " 到 " 做 " 的转型中,Anthropic   提供了一个参考样本。从早期的   Claude Code   到最近刚刚上线、面向大众协作的   Cowork,尽管   Cowork   作为一个新产品,其实际体验和用户口碑还有待时间验证,但它所代表的方向是清晰的:最强大的   Agent,一定来自基模厂商。

在中国,谁能成为那个 " 中国的   Anthropic"?

答案不在于谁的模型跑分更高,而在于谁能最先做出第三代   AI   助手。这个助手需要满足三个严苛的条件:

第一、它必须具备原生的   Agent   能力,而不是靠外部提示词工程堆砌出来的 " 伪智能 "; 

第二、它必须能处理长时任务(Long-horizon tasks),能像人类员工一样,为了一个目标连续工作数小时甚至数天,而不是聊几句就 " 断片 ";

第三、它必须拥有闭环的数据飞轮,让每一次任务执行的成败,都能成为模型进化的养料。

在这个维度上,国内的模型创业者们正在加速。行业看到,DeepSeek   选择了能把 Agent 推理价格持续降下去的底层方案做突破,暂时没有在产品层发力;而   Kimi   依托自己的 K2 系列模型 Agent   能力,在 " 深度研究 ""PPT"" 数据分析 " 等生产力场景上有了忠实用户群,也初步验证了他们的会员付费能力。智谱则通过开源 AutoGLM 模型,想让会操作手机的 Agent 给每个人日常生活带来帮助。

对于用户而言,谁是 " 中国的   Anthropic" 并不重要。重要的是,当那个对话框消失,取而代之的是一个真正能独立思考、并在后台默默把活儿干完的帮手时,市场才算真正迎来了   Agent   的时代。

毕竟,最好的   AI,不是让你惊叹技术有多强,而是能让你觉得自己有多强。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai python siri 语音控制 界面
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论