实测腾讯Marvis，我们距离成为“钢铁侠”还有多远？

参考图片来自腾讯产品 Marvis

作者丨钱江

编辑｜山茶

最近，腾讯又推出了一款新的 AI 产品—— Marvis，并在行业里引起大范围的讨论。

Marvis，听这个名字，就知道这是在致敬 Jarvis ——这个人是钢铁侠的亲密助理，也是人工智能领域最经典的荧幕形象。

对钢铁侠或者漫威有过了解的朋友肯定都知道，Jarvis 是一个多么强大的 AI 助理。

它会在钢铁侠实验着火的时候主动拿来灭火器灭火（日常应变）；能够在钢铁侠仅仅给出一个指引的情况下，自动测算出用虫洞穿越时间的方法（科研能力），以及在钢铁侠遇到危险、性命垂危的时候，主动帮钢铁侠拨通爱人的电话（情感陪伴）......

它是一个真正的全能助理，从生活到工作；它也真正理解并懂得主人的需求，并在适当的时候主动帮助主人做出选择。

可以说，没有人会在了解 Jarvis 之后，不想拥有一个 Jarvis；因此这个形象也成为人工智能助理最完美的预设。

所以，腾讯给自己的 AI 产品取这么一个名字，其想法其实已经昭然若揭——想要打造类似 Jarvis 一样，全能的、真正如人类助理一样角色的 AI 产品。

这个想法肯定是好的，但，腾讯这个目标能实现吗？或者说，腾讯实现这个目标的第一步，走稳了吗？

Marvis，刻意经营的 " 活人 " 形象

为了了解实际情况，我们全程体验了 Marvis 这款产品。

可能是为了让 Marvis 与 Jarvis 更接近，反正从进入 Marvis 的产品页面，到真正将其安装到电脑上，这个过程中的每一步，都有腾讯刻意营造的，一种扑面而来的 " 活人感 "。

首先是 Marvis 的形象，一匹带着红围脖的马，马年、腾讯马化腾，以及现在无数打工人都自称 " 牛马 "，这种设定一开始就在想拉近与用户的距离。

其次，在 Marvis 初始界面，Marvis 一边给自己补充 Token，一边办理 " 入职手续 "。

这个画面也很 " 腾讯 "。因为现实中，腾讯员工完成入职时，也会进入一套名为 " 红围脖 " 的服务平台。所谓 " 戴上红围脖，成为鹅厂人 "，到了 Marvis 这里，也有了类似的入职仪式。

但 Marvis 的 " 活人感 " 不只来自这匹小马，还来自它为 Agent 搭出的整套办公室。

在这个虚拟办公区里，" 老板 "Marvis 坐在前排，后面是五个组员：App Agent、File Agent、Computer Agent、Browser Agent 和 Search Agent。

它们各自负责不同任务，但呈现出来的不是功能模块，而是一群正在上班的 " 同事 "，它们有人去茶水间吃零食，有人去健身房活动，有人能在厕所里蹲着刷手机、自由抽纸。

偶尔，它们还能互相窜工位，看 " 同事 " 打王者荣耀，顺便交流几句，整个办公室明亮、整洁，员工穿得整齐体面，像是一个真正的企业环境。

从外部的视角来看，这像是产品经理将腾讯的企业文化和办公日常搬到了线上，Marvis 这匹小马，就像是一位真正的腾讯员工一样。

但我们和腾讯的朋友讨论，他们却说，这显然不是真正的腾讯，因为真正的打工人没有这么松弛。

他们开玩笑地讲，这或许是腾讯老板眼中的腾讯，也或许，是一些腾讯打工人心中理想的腾讯。

但玩笑归玩笑，无论产品宣传的氛围多么有 " 活人感 "，Agent 产品最终还是要回到一个最朴素的问题：它到底能不能把活儿干好。

给 Marvis 做个上岗测试

那么，Marvis 的实际能力如何呢？

在正式使用之前，我们看了许多宣传，基于其系统级 AI 助手的定位，我们对 Marvis 的能力有着很高的预期。

因此我们的第一个任务是：让其调用电脑端已经存储好的图片，然后用 PS 完成公众号文章封面的制作。

我们设定了一个提示词：

帮我打开已提供的 PSD 文件，将其中的底图图层替换为我提供的新图片，保持原 PSD 的画布尺寸、图层结构、文字、特效与排版不变。替换后，检查图片位置、比例与裁切是否正确，避免变形或错位。最后导出高质量 JPG 文件，并保存到电脑【下载】文件夹。

我们期待的结果是这样的，这是我们日常使用的封面：

而 Marvis 实际给到的结果是这样的：

按理来说，作为系统级的 AI 助理，Marvis 应该用 Computer Agent 直接打开 PSD 文件，用我给它的图片替换掉原来的图片，并重新导出一个图片。

但在实际执行过程中，Marvis 选择的却是 File Agent，并且运行了很久。

为此，我还特意和 Marvis 确认了一下，但它坚持应该使用 File Agent，而实际输出的结果，却始终不尽如人意。

如果说PSD测试考验的是本地软件调用能力，那么接下来的测试，就看它能不能在网页环境里完成一组连续操作。

我尝试要求搜索并打开 SpaceX 的招股书，重点提炼其股权结构、收入结构、核心业务占比，以及近年营收、利润和主要增长业务。

Marvis 派出了 Browser Agent 联网搜索，交付了一份表格，列出每一项，但仔细看，出现了一个很离谱的错误，本地表格中的关键数据都被抹去了一个 " 开头 "：

比如 Space X 在 2025 年的全年营收是 187 亿美金，而 Excel 表格写成 "87 亿 " 美金。

Marvis 算是基本完成了任务，但是交付的结果却存在重大问题…

但在这个过程中，我其实也在反思，是不是我提出的要求本身就超出了这个产品的能力？

所以在后续的测试中，我不再从 " 我想让它做什么 " 的角度出发，而是从 " 它能做什么 " 的角度出发。

从 Marvis 给出的引导功能来看，它默认强调的操作系统级能力，主要集中在三个方向。

第一类是电脑设置和系统检查，比如检查电池健康状况、查看电脑中 App 的状态、提醒哪些软件可能需要更新。

第二类是本地文档和图库的归类处理。比如，它可以尝试识别电脑里的文件类型，把资料按照用途重新整理。但这部分体验里也会出现一些 " 谜之操作 "，例如把一些大摩的研究报告归类成 " 简历 "。

第三类是定时处理一些标准化任务。比如，设置每天 17:00 自动查看 GitHub 当日热门项目，或者订阅《哈哈哈哈哈 6》的更新提醒。这类任务本质上更像 " 提醒 + 固定流程 "，路径清楚、动作明确，比较适合交给 Agent 执行。

那么，在这个范畴内，Marvis 的完成度如何？

先试试系统设定好的【记不住 Mac 快捷键】任务，点击后，数秒钟就完成了任务，并生成了速查图片：

系统设定好的任务欠缺挑战性，那么，在这个范畴内新建的任务呢？

我让 Marvis 帮我检查电脑上已安装的办公类 App，找出哪些还没有更新到最新版本，并试着让它帮我完成一部分 App 更新。

我给出提示词：

请检查我电脑上已安装的办公类 App，找出哪些还没有更新到最新版本。重点包括 Office、WPS、飞书、钉钉、企业微信、腾讯会议、Zoom、Notion、Obsidian、Adobe Acrobat、OneDrive、Google Drive、Dropbox 等办公、协作、文档和效率类软件。请只检查版本，不要自动更新、卸载或修改设置。最后用表格列出 App 名称、当前版本、最新版本、是否需要更新、检查渠道和备注；无法确认的请标注 " 待人工确认 "。

很快，Marvis 给出了一份诊断报告：

它提示了我 6 月 12 日之前需要更新 ChatGPT，于是我要求 Marvis 帮我下载，但结果不如人意，Marvis 几乎没有任何浏览器的调用权。

在多番尝试失败后，给了我一份手动下载建议：

从这几个任务来看，Marvis 的能力需要分两个维度来看：

一方面是在系统设定的固定任务中，Marvis 的完成度较高；但另一方面，一旦任务进入开放环境，它的表现就差强人意。

也可以理解为，Marvis 和市场上的龙虾产品本质差不多，需要结合一些 skill 或 workflow 封装流程，来完成任务。

从我们的结果来看，Marvis 给我们带来的问题是，一开始的宣传拔高了我们的预期，而实际能力又无法兑现宣传的结果，因此让我们在测试的过程中有了一个明显的心理落差。

但除此之外，即便抛开这种心理落差，Marvis 能够给用户提供的价值其实也十分基础，甚至有些鸡肋：

比如文档检索、资料整理，现在市面上有非常多的资料管理和检索工具，效率和结果都要比Marvis 好很多；再比如任务拆解和内容生成就更不用提了，都不需要拿国际上的其他产品做对比，仅仅是腾讯自家的 Workbuddy，其完成度就要比 Marvis 高很多。

Marvis 和市场上同类龙虾产品的不同之处，更多在于它把这项能力单独拎出来，包装成了一个更明确的产品卖点，但实际体验还没有证明它比别人干得更好。

所以，体验到这里，我其实有个疑问，腾讯起这么一个高调，但给出这样一个产品，Marvis 的意义又是什么呢？

Marvis，产品化的 OpenClaw?

从宣传口径上，Marvis 是操作系统层级 AI 助手，这意味着它可以根据指令，直接操作用户的电脑，帮助用户完成一些工作。

怎么样，这个形容是不是听起来很耳熟？没错，之前风靡全网的 OpenClaw（龙虾）也是这么宣传的。

事实上，从产品层面目标的角度来讲，Marvis 和龙虾是一致的，所以他们的很多能力 / 功能也非常相似，比如都可以直接操作用户电脑，都可以直接帮助用户完成一些工作等等。

它们的差异点在于，OpenClaw 是一种框架，它把更多的选择权和控制权都交给了用户，比如需要用户自己部署 Gateway，连接各种聊天通道，再配置模型、工具、插件和权限。

而 Marvis 则更像是一个完全产品化的龙虾，真正的开箱即用。

比如，Marvis 弱化了模型的概念。

界面里看不到模型选项，用户也不用在 GPT、Claude、通义千问、MiniMax 之间来回切换。它更像是默认替你选好了底座，大概率是腾讯自家的混元大模型。相比之下，很多龙虾产品会把模型选择放在前台，甚至把 " 支持多少模型 " 本身当成卖点。

比如，Marvis 做了一个 skill 合集社区，但和龙虾产品一板一眼的 skill 列表式呈现不同，Marvis 界面就像小红书笔记一样。标题要足够抓人，封面要足够夸张，每个 skill 都被包装成一个看起来很有用、很适合收藏的 " 经验帖 "。

每个 skill 下方还会标注来源，看上去像是一个允许用户上传、分享 skill 的 UGC 社区。但目前在 Marvis 里，并没有看到上传 skill 的入口。所以这些 skill 更可能还处在官方筛选或定向邀请阶段，也就是说，它看起来像社区，但暂时还不是一个真正开放的社区。

总的来说，使用 Marvis，用户不需要知道什么是 Agent、Gateway、Plugin、API Key，只要像微信一样下载，安装，然后就可以给 Marvis 下达指令，比如：根据电脑中的论文资料，帮我拟定一个开题报告。

所以，Marvis 目前最核心的价值，或许是先把 "AI 模拟真人操作电脑系统 " 这个概念做成了一个可体验的产品。

它让用户看到了一种方向：未来的 AI 助手不只是在聊天框里回答问题，而是可以进入电脑、理解资料、执行任务。但就当前体验来说，它更像是把这个方向先占住了，而真正的能力突破，还没有完全发生。

Marvis 为什么没变成 "Jarvis"？

最后，我们来反思一下 Marvis 的体验过程。

说实话，上手之前，Marvis " 操作系统级 " 的宣传确实抬高了我们的预期。

在还没使用之前，我和朋友讨论时都觉得，这才是 Agent 产品真正应该做的方向，把 OpenClaw 没有做好的工作做好，封装成产品，降低用户使用门槛，让 AI 不只是聊天、调用工具或执行封装流程，而是能真正进入电脑环境，替人打开软件、处理文件、操作网页，像真人一样连续完成任务。

也正因为如此，我们期待的不是又一个 AI 助手，而是它能在 " 模拟人类操作电脑 " 这件事上，比市场上现有产品更进一步。

但实际体验下来，期待越高，落差也越明显。

当然，这不只是 Marvis 的问题。它遇到的难点，也是整个 Agent 市场正在攻克的方向：如何让 AI 不只是会回答、会调用工具，而是真的能在真实操作环境里把活儿干好。

第一个难点，是应用权限。

Marvis 能当电脑的 " 二房东 "，前提是用户把本地权限交给了它，所以它可以管理本地文件、检查系统状态、整理桌面资料。

但今天很多资料并不在本地，而是在微信、印象笔记、飞书、腾讯文档、网盘和邮箱里。真正有用的 Agent，应该能进入这些日常应用，把分散的信息找出来、读进去、再整理出来。

现实是，微信不在 Marvis 的权限列表里。

印象笔记也不在可操作范围内。

但有意思的是，Marvis 有一种契而不舍的 " 牛马精神 "，它虽然没有权限接入 App，但它给了我一个 " 小相机 "，让我把相关页面拍给它看，再继续识别和处理。

这很像两点之间本来直线最短，但中间每个路口都有人收费，于是只能不断绕路。最后事情也许能做成，但效率和体验都打了折扣。

Agent 要真正好用，本质上要把用户常用应用都做成 tools 接进去。但问题是，接口掌握在各个平台手里。微信未必开放，印象笔记未必开放，淘宝、支付宝更不可能轻易开放。各大平台更愿意自己做生态，而不是把入口交出去。

第二个难点，是技术本身。

Agent 在电脑里操作，和人形机器人进家庭干家务很像：标准化环境里能做，泛化环境里就会遇到无数卡点。

电脑界面本身不是结构化数据。人看屏幕时，天然知道哪里是按钮、哪里是输入框、哪个弹窗必须处理、哪个文件像论文；但 AI 看到的首先只是截图。它必须先把截图理解成可操作的界面结构，再判断下一步点哪里、输什么、打开哪个文件。

所以，单次点击成功不难，难的是连续几十步都不出错。搜索文件、筛选日期、判断主题、复制资料、阅读内容、生成文档、保存到桌面，任何一步出错，后面都会累积偏差。

Marvis 提出了一个很美好的未来：AI 进入电脑，成为用户和操作系统之间的新中介。但要真正变成电脑里的 "Jarvis"，还要跨过应用权限、生态接口和长任务稳定性这几道坎。

结语

AI 时代，腾讯一直被寄予更高的期待。

马化腾在 2023 年 5 月的股东大会上称：" 对于工业革命级的机遇来讲，早一个月还是晚一个月把电灯泡拿出来，在长的时间跨度上来看，是不那么重要的。"

到了 2026 年 5 月的股东大会，马化腾再次回应外界关于腾讯 AI" 落后 " 的说法：" 原来一年前我们以为上了船，后来发现那个船漏水了，现在感觉站上去了，还坐不下去，还是希望船速能快一点。"

他同时提到：" 公司曾盲目跟风涉足非优势领域，跟风布局各类热门赛道，最终大多以失利告终。面对本轮人工智能发展浪潮，我们时刻保持理性清醒，坚决规避过往发展误区。"

从这几次发言来看，腾讯对 AI 的态度一直以 " 稳 " 为主：不急着抢第一时间的声量，而是希望 AI 成为业务的 " 增倍器 "，结合具体场景解决问题。

但进入 2026 年，腾讯在 AI C 端上的动作明显变得频繁：2 月春节期间，" 元宝 " 上线 AI 社交；3 月推出 " 龙虾阵 "，微信开放 ClawBot 接口；4 月上线 AI 影游产品探梦 DreamNow；5 月上线 Marvis。

所以，面对 AI，腾讯并不是不焦虑。它只是把焦虑包装得更克制。

这种焦虑并不难理解。现实情况是，整个 AI 行业都在面对同一个问题：产品越来越多，入口越来越多，但真正能够改变用户习惯的杀手级应用，还没有完全出现。就像 Marvis 产品经理直言，" 坦白说，我们当下真没有杀手锏 "。

这句话也解释了 Marvis 的位置。它并不是腾讯已经找到答案之后推出的产品，而更像是在答案尚未清晰之前，先把一个可能的方向推到用户面前：让 AI 从聊天框里走出来，进入电脑，接管文件、应用和任务。

* 文中配图来源于网络

- END -

欢迎添加微信：cyxx-z

加入「有界 UnKnown」科技交流群

人与 AI 恋爱的 " 罪与罚 "

为什么 Image2+ViduQ3，是视频降本增效的王炸组合？

AI 能替代演员吗？

宙世代

一起剪

相关标签