《科创板日报》2 月 26 日讯(编辑 宋子乔) 当地时间 2 与 25 日,Anthropic 宣布收购西雅图 AI 初创公司 Vercept,为自家智能体(Agent)工具 "Computer Use" 补上视觉短板。
Computer Use 是 Anthropic 为旗下 AI 大模型 Claude 打造的、使其直接操控电脑的核心能力,能让 Claude 可以像人一样 " 看屏幕、动鼠标、敲键盘、操作软件 ",完成多步骤、跨应用的复杂任务,于 2024 年 10 月随 Claude 3.5 Sonnet 一同发布。
可以说,Computer Use 是 Anthropic 进军 AI 智能体领域的关键一步。
而Vercept 意在打造视觉优先(Vision first)的 AI 智能体,主打 " 像人一样看屏幕、操控电脑 " 的无 API 自动化,与 Computer Use 的卖点类似。
Anthropic 此次收购,意在补齐其 AI 模型在视觉理解精度上存在的短板。人们正用 Claude 处理日益复杂的工作——编写跨整个代码库的代码、整合数十个来源的研究成果、管理跨越多个工具的工作流程。借助计算机,Claude 能在实时应用中完成这些操作,处理多步骤任务,解决仅靠代码无法解决的问题。
Vercept 在高精度 UI 识别、空间推理方面的积累正好补上这块拼图。该公司脱胎于艾伦人工智能研究所(Allen Institute for AI,AI2),创始团队堪称顶配—— CEO Kiana Ehsani 曾负责 AI2 机器人与具身智能团队,联合创始人 Luca Weihs 深耕 AI Agent 与强化学习,Ross Girshick 则是计算机视觉领域的先驱人物。公司成立仅一年多,累计融资 5000 万美元,投资阵容包括前谷歌 CEO 施密特、DeepMind 首席科学家杰夫•迪恩等。
在 Vercept 的团队看来,要让 AI 真正有效地完成复杂任务,就必须解决感知和交互难题。其产品 Vy 不走 " 读代码 " 路线,而是采用视觉优先方案——通过视觉模型理解屏幕上的每一颗按钮,再模拟鼠标键盘操作,这意味着它能操控任何有屏幕的软件。在 UI 元素识别基准 ScreenSpot v1 上,其自研模型准确率高达 92%,而 OpenAI 同类模型仅为 18.3%。
此次收购紧随 Anthropic 新一代模型 Claude Sonnet 4.6 发布之后。在 OSWorld 评估中,Sonnet 模型准确率从 2024 年底的不足 15% 提升至如今的 72.5%,在浏览复杂电子表格、跨标签页填写表单等任务上已接近人类水平。
这是 Anthropic 第二笔公开收购——去年 12 月刚收购编码代理引擎 Bun。两笔收购指向同一方向:让 Claude 不仅能写代码,还能像人一样在各类软件中实时操作。
Vercept 产品 Vy 将于 3 月 25 日关闭,团队正式加盟 Anthropic。
关于 Anthropic
Anthropic 由前 OpenAI 研究副总裁达里奥•阿莫迪兄妹于 2021 年创立,核心团队曾参与 GPT-2 和 GPT-3 的早期研发。因对 OpenAI 的发展方向存在分歧,他们离职创办了这家致力于 AI 安全与研究的公司。
凭借创始人团队的光鲜背景,该公司融资步伐迅猛,自成立以来累计融资额已超 300 亿美元。2026 年 2 月,公司刚完成 300 亿美元 G 轮融资,投后估值飙升至 3800 亿美元,使其成为全球估值第二高的 AI 独角兽,仅次于 OpenAI。本轮融资参与方包括光速创投(Lightspeed Venture Partners)、门洛风险投资(Menlo Ventures)、摩根士丹利投资(Morgan Stanley Investment)、NX1 资本(NX1 Capital)及卡塔尔投资局(Qatar Investment Authority)。
Anthropic 最核心的产品是 Claude 系列大语言模型,按照能力梯队划分为三个层级:
Claude Opus 系列:旗舰级模型,代表当前最高智能水平。
Claude Sonnet 系列:性能与成本的平衡之选,也是大众用户接触最多的模型。
Claude Haiku 系列:轻量级模型,主打快速响应和低成本,适用于实时交互场景。
基于上述模型,Anthropic 开发了 AI 编程助手 Claude Code 和办公场景智能体 Claude Cowork。Anthropic 的年化营收在 2025 年年底超过 90 亿美元,其中,Claude Code 的年化收入已达 25 亿美元。


登录后才可以发布评论哦
打开小程序可以发布评论哦