产业象限 3小时前
实测腾讯Marvis,我们距离成为“钢铁侠”还有多远?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

参考图片来自腾讯产品 Marvis

© 有界 UnKnown 原创

作者丨钱江

编辑|山茶

最近,腾讯又推出了一款新的 AI 产品—— Marvis,并在行业里引起大范围的讨论。

Marvis,听这个名字,就知道这是在致敬 Jarvis ——这个人是钢铁侠的亲密助理,也是人工智能领域最经典的荧幕形象。

对钢铁侠或者漫威有过了解的朋友肯定都知道,Jarvis 是一个多么强大的 AI 助理。

它会在钢铁侠实验着火的时候主动拿来灭火器灭火(日常应变);能够在钢铁侠仅仅给出一个指引的情况下,自动测算出用虫洞穿越时间的方法(科研能力),以及在钢铁侠遇到危险、性命垂危的时候,主动帮钢铁侠拨通爱人的电话(情感陪伴)......

它是一个真正的全能助理,从生活到工作;它也真正理解并懂得主人的需求,并在适当的时候主动帮助主人做出选择。

可以说,没有人会在了解 Jarvis 之后,不想拥有一个 Jarvis;因此这个形象也成为人工智能助理最完美的预设。

所以,腾讯给自己的 AI 产品取这么一个名字,其想法其实已经昭然若揭——想要打造类似 Jarvis 一样,全能的、真正如人类助理一样角色的 AI 产品。

这个想法肯定是好的,但,腾讯这个目标能实现吗?或者说,腾讯实现这个目标的第一步,走稳了吗?

Marvis,刻意经营的 " 活人 " 形象

为了了解实际情况,我们全程体验了 Marvis 这款产品。

可能是为了让 Marvis 与 Jarvis 更接近,反正从进入 Marvis 的产品页面,到真正将其安装到电脑上,这个过程中的每一步,都有腾讯刻意营造的,一种扑面而来的 " 活人感 "。

首先是 Marvis 的形象,一匹带着红围脖的马,马年、腾讯马化腾,以及现在无数打工人都自称 " 牛马 ",这种设定一开始就在想拉近与用户的距离。

其次,在 Marvis 初始界面,Marvis 一边给自己补充 Token,一边办理 " 入职手续 "。

这个画面也很 " 腾讯 "。因为现实中,腾讯员工完成入职时,也会进入一套名为 " 红围脖 " 的服务平台。所谓 " 戴上红围脖,成为鹅厂人 ",到了 Marvis 这里,也有了类似的入职仪式。

但 Marvis 的 " 活人感 " 不只来自这匹小马,还来自它为 Agent 搭出的整套办公室。

在这个虚拟办公区里," 老板 "Marvis 坐在前排,后面是五个组员:App Agent、File Agent、Computer Agent、Browser Agent 和 Search Agent。

它们各自负责不同任务,但呈现出来的不是功能模块,而是一群正在上班的 " 同事 ",它们有人去茶水间吃零食,有人去健身房活动,有人能在厕所里蹲着刷手机、自由抽纸。

偶尔,它们还能互相窜工位,看 " 同事 " 打王者荣耀,顺便交流几句,整个办公室明亮、整洁,员工穿得整齐体面,像是一个真正的企业环境。

从外部的视角来看,这像是产品经理将腾讯的企业文化和办公日常搬到了线上,Marvis 这匹小马,就像是一位真正的腾讯员工一样。

但我们和腾讯的朋友讨论,他们却说,这显然不是真正的腾讯,因为真正的打工人没有这么松弛。

他们开玩笑地讲,这或许是腾讯老板眼中的腾讯,也或许,是一些腾讯打工人心中理想的腾讯。

但玩笑归玩笑,无论产品宣传的氛围多么有 " 活人感 ",Agent 产品最终还是要回到一个最朴素的问题:它到底能不能把活儿干好。

给 Marvis 做个上岗测试

那么,Marvis 的实际能力如何呢?

在正式使用之前,我们看了许多宣传,基于其系统级 AI 助手的定位,我们对 Marvis 的能力有着很高的预期。

因此我们的第一个任务是:让其调用电脑端已经存储好的图片,然后用 PS 完成公众号文章封面的制作。

我们设定了一个提示词:

帮我打开已提供的 PSD 文件,将其中的底图图层替换为我提供的新图片,保持原 PSD 的画布尺寸、图层结构、文字、特效与排版不变。替换后,检查图片位置、比例与裁切是否正确,避免变形或错位。最后导出高质量 JPG 文件,并保存到电脑【下载】文件夹。

我们期待的结果是这样的,这是我们日常使用的封面:

而 Marvis 实际给到的结果是这样的:

按理来说,作为系统级的 AI 助理,Marvis 应该用 Computer Agent 直接打开 PSD 文件,用我给它的图片替换掉原来的图片,并重新导出一个图片。

但在实际执行过程中,Marvis 选择的却是 File Agent,并且运行了很久。

为此,我还特意和 Marvis 确认了一下,但它坚持应该使用 File Agent,而实际输出的结果,却始终不尽如人意。

如果说PSD测试考验的是本地软件调用能力,那么接下来的测试,就看它能不能在网页环境里完成一组连续操作。

我尝试要求搜索并打开 SpaceX 的招股书,重点提炼其股权结构、收入结构、核心业务占比,以及近年营收、利润和主要增长业务。

Marvis 派出了 Browser Agent 联网搜索,交付了一份表格,列出每一项,但仔细看,出现了一个很离谱的错误,本地表格中的关键数据都被抹去了一个 " 开头 ":

比如 Space X 在 2025 年的全年营收是 187 亿美金,而 Excel 表格写成 "87 亿 " 美金。

Marvis 算是基本完成了任务,但是交付的结果却存在重大问题…

但在这个过程中,我其实也在反思,是不是我提出的要求本身就超出了这个产品的能力?

所以在后续的测试中,我不再从 " 我想让它做什么 " 的角度出发,而是从 " 它能做什么 " 的角度出发。

从 Marvis 给出的引导功能来看,它默认强调的操作系统级能力,主要集中在三个方向。

第一类是电脑设置和系统检查,比如检查电池健康状况、查看电脑中 App 的状态、提醒哪些软件可能需要更新。

第二类是本地文档和图库的归类处理。比如,它可以尝试识别电脑里的文件类型,把资料按照用途重新整理。但这部分体验里也会出现一些 " 谜之操作 ",例如把一些大摩的研究报告归类成 " 简历 "。

第三类是定时处理一些标准化任务。比如,设置每天 17:00 自动查看 GitHub 当日热门项目,或者订阅《哈哈哈哈哈 6》的更新提醒。这类任务本质上更像 " 提醒 + 固定流程 ",路径清楚、动作明确,比较适合交给 Agent 执行。

那么,在这个范畴内,Marvis 的完成度如何?

先试试系统设定好的【记不住 Mac 快捷键】任务,点击后,数秒钟就完成了任务,并生成了速查图片:

系统设定好的任务欠缺挑战性,那么,在这个范畴内新建的任务呢?

我让 Marvis 帮我检查电脑上已安装的办公类 App,找出哪些还没有更新到最新版本,并试着让它帮我完成一部分 App 更新。

我给出提示词:

请检查我电脑上已安装的办公类 App,找出哪些还没有更新到最新版本。重点包括 Office、WPS、飞书、钉钉、企业微信、腾讯会议、Zoom、Notion、Obsidian、Adobe Acrobat、OneDrive、Google Drive、Dropbox 等办公、协作、文档和效率类软件。请只检查版本,不要自动更新、卸载或修改设置。最后用表格列出 App 名称、当前版本、最新版本、是否需要更新、检查渠道和备注;无法确认的请标注 " 待人工确认 "。

很快,Marvis 给出了一份诊断报告:

它提示了我 6 月 12 日之前需要更新 ChatGPT,于是我要求 Marvis 帮我下载,但结果不如人意,Marvis 几乎没有任何浏览器的调用权。

在多番尝试失败后,给了我一份手动下载建议:

从这几个任务来看,Marvis 的能力需要分两个维度来看:

一方面是在系统设定的固定任务中,Marvis 的完成度较高;但另一方面,一旦任务进入开放环境,它的表现就差强人意。

也可以理解为,Marvis 和市场上的龙虾产品本质差不多,需要结合一些 skill 或 workflow 封装流程,来完成任务。

从我们的结果来看,Marvis 给我们带来的问题是,一开始的宣传拔高了我们的预期,而实际能力又无法兑现宣传的结果,因此让我们在测试的过程中有了一个明显的心理落差。

但除此之外,即便抛开这种心理落差,Marvis 能够给用户提供的价值其实也十分基础,甚至有些鸡肋:

比如文档检索、资料整理,现在市面上有非常多的资料管理和检索工具,效率和结果都要比Marvis 好很多;再比如任务拆解和内容生成就更不用提了,都不需要拿国际上的其他产品做对比,仅仅是腾讯自家的 Workbuddy,其完成度就要比 Marvis 高很多。

Marvis 和市场上同类龙虾产品的不同之处,更多在于它把这项能力单独拎出来,包装成了一个更明确的产品卖点,但实际体验还没有证明它比别人干得更好。

所以,体验到这里,我其实有个疑问,腾讯起这么一个高调,但给出这样一个产品,Marvis 的意义又是什么呢?

Marvis,产品化的 OpenClaw?

从宣传口径上,Marvis 是操作系统层级 AI 助手,这意味着它可以根据指令,直接操作用户的电脑,帮助用户完成一些工作。

怎么样,这个形容是不是听起来很耳熟?没错,之前风靡全网的 OpenClaw(龙虾)也是这么宣传的。

事实上,从产品层面目标的角度来讲,Marvis 和龙虾是一致的,所以他们的很多能力 / 功能也非常相似,比如都可以直接操作用户电脑,都可以直接帮助用户完成一些工作等等。

它们的差异点在于,OpenClaw 是一种框架,它把更多的选择权和控制权都交给了用户,比如需要用户自己部署 Gateway,连接各种聊天通道,再配置模型、工具、插件和权限。

而 Marvis 则更像是一个完全产品化的龙虾,真正的开箱即用。

比如,Marvis 弱化了模型的概念。

界面里看不到模型选项,用户也不用在 GPT、Claude、通义千问、MiniMax 之间来回切换。它更像是默认替你选好了底座,大概率是腾讯自家的混元大模型。相比之下,很多龙虾产品会把模型选择放在前台,甚至把 " 支持多少模型 " 本身当成卖点。

比如,Marvis 做了一个 skill 合集社区,但和龙虾产品一板一眼的 skill 列表式呈现不同,Marvis 界面就像小红书笔记一样。标题要足够抓人,封面要足够夸张,每个 skill 都被包装成一个看起来很有用、很适合收藏的 " 经验帖 "。

每个 skill 下方还会标注来源,看上去像是一个允许用户上传、分享 skill 的 UGC 社区。但目前在 Marvis 里,并没有看到上传 skill 的入口。所以这些 skill 更可能还处在官方筛选或定向邀请阶段,也就是说,它看起来像社区,但暂时还不是一个真正开放的社区。

总的来说,使用 Marvis,用户不需要知道什么是 Agent、Gateway、Plugin、API Key,只要像微信一样下载,安装,然后就可以给 Marvis 下达指令,比如:根据电脑中的论文资料,帮我拟定一个开题报告。

所以,Marvis 目前最核心的价值,或许是先把 "AI 模拟真人操作电脑系统 " 这个概念做成了一个可体验的产品。

它让用户看到了一种方向:未来的 AI 助手不只是在聊天框里回答问题,而是可以进入电脑、理解资料、执行任务。但就当前体验来说,它更像是把这个方向先占住了,而真正的能力突破,还没有完全发生。

Marvis 为什么没变成 "Jarvis"?

最后,我们来反思一下 Marvis 的体验过程。

说实话,上手之前,Marvis " 操作系统级 " 的宣传确实抬高了我们的预期。

在还没使用之前,我和朋友讨论时都觉得,这才是 Agent 产品真正应该做的方向,把 OpenClaw 没有做好的工作做好,封装成产品,降低用户使用门槛,让 AI 不只是聊天、调用工具或执行封装流程,而是能真正进入电脑环境,替人打开软件、处理文件、操作网页,像真人一样连续完成任务。

也正因为如此,我们期待的不是又一个 AI 助手,而是它能在 " 模拟人类操作电脑 " 这件事上,比市场上现有产品更进一步。

但实际体验下来,期待越高,落差也越明显。

当然,这不只是 Marvis 的问题。它遇到的难点,也是整个 Agent 市场正在攻克的方向:如何让 AI 不只是会回答、会调用工具,而是真的能在真实操作环境里把活儿干好。

第一个难点,是应用权限。

Marvis 能当电脑的 " 二房东 ",前提是用户把本地权限交给了它,所以它可以管理本地文件、检查系统状态、整理桌面资料。

但今天很多资料并不在本地,而是在微信、印象笔记、飞书、腾讯文档、网盘和邮箱里。真正有用的 Agent,应该能进入这些日常应用,把分散的信息找出来、读进去、再整理出来。

现实是,微信不在 Marvis 的权限列表里。

印象笔记也不在可操作范围内。

但有意思的是,Marvis 有一种契而不舍的 " 牛马精神 ",它虽然没有权限接入 App,但它给了我一个 " 小相机 ",让我把相关页面拍给它看,再继续识别和处理。

这很像两点之间本来直线最短,但中间每个路口都有人收费,于是只能不断绕路。最后事情也许能做成,但效率和体验都打了折扣。

Agent 要真正好用,本质上要把用户常用应用都做成 tools 接进去。但问题是,接口掌握在各个平台手里。微信未必开放,印象笔记未必开放,淘宝、支付宝更不可能轻易开放。各大平台更愿意自己做生态,而不是把入口交出去。

第二个难点,是技术本身。

Agent 在电脑里操作,和人形机器人进家庭干家务很像:标准化环境里能做,泛化环境里就会遇到无数卡点。

电脑界面本身不是结构化数据。人看屏幕时,天然知道哪里是按钮、哪里是输入框、哪个弹窗必须处理、哪个文件像论文;但 AI 看到的首先只是截图。它必须先把截图理解成可操作的界面结构,再判断下一步点哪里、输什么、打开哪个文件。

所以,单次点击成功不难,难的是连续几十步都不出错。搜索文件、筛选日期、判断主题、复制资料、阅读内容、生成文档、保存到桌面,任何一步出错,后面都会累积偏差。

Marvis 提出了一个很美好的未来:AI 进入电脑,成为用户和操作系统之间的新中介。但要真正变成电脑里的 "Jarvis",还要跨过应用权限、生态接口和长任务稳定性这几道坎。

结语

AI 时代,腾讯一直被寄予更高的期待。

马化腾在 2023 年 5 月的股东大会上称:" 对于工业革命级的机遇来讲,早一个月还是晚一个月把电灯泡拿出来,在长的时间跨度上来看,是不那么重要的。"

到了 2026 年 5 月的股东大会,马化腾再次回应外界关于腾讯 AI" 落后 " 的说法:" 原来一年前我们以为上了船,后来发现那个船漏水了,现在感觉站上去了,还坐不下去,还是希望船速能快一点。"

他同时提到:" 公司曾盲目跟风涉足非优势领域,跟风布局各类热门赛道,最终大多以失利告终。面对本轮人工智能发展浪潮,我们时刻保持理性清醒,坚决规避过往发展误区。"

从这几次发言来看,腾讯对 AI 的态度一直以 " 稳 " 为主:不急着抢第一时间的声量,而是希望 AI 成为业务的 " 增倍器 ",结合具体场景解决问题。

但进入 2026 年,腾讯在 AI C 端上的动作明显变得频繁:2 月春节期间," 元宝 " 上线 AI 社交;3 月推出 " 龙虾阵 ",微信开放 ClawBot 接口;4 月上线 AI 影游产品探梦 DreamNow;5 月上线 Marvis。

所以,面对 AI,腾讯并不是不焦虑。它只是把焦虑包装得更克制。

这种焦虑并不难理解。现实情况是,整个 AI 行业都在面对同一个问题:产品越来越多,入口越来越多,但真正能够改变用户习惯的杀手级应用,还没有完全出现。就像 Marvis 产品经理直言," 坦白说,我们当下真没有杀手锏 "。

这句话也解释了 Marvis 的位置。它并不是腾讯已经找到答案之后推出的产品,而更像是在答案尚未清晰之前,先把一个可能的方向推到用户面前:让 AI 从聊天框里走出来,进入电脑,接管文件、应用和任务。

* 文中配图来源于网络

  - END -  

欢迎添加微信:cyxx-z

加入「有界 UnKnown」科技交流群

人与 AI 恋爱的 " 罪与罚 "

为什么 Image2+ViduQ3,是视频降本增效的王炸组合?

AI 能替代演员吗?

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

钢铁侠 腾讯 ai 人工智能 漫威
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论