B 站一场直播,一个老外的四个字直接炸了弹幕区—— " 不熟,勿 Cue"。说这话的是全球爆火开源 Agent 项目 Hermes Agent 的业务负责人 Tommy Eastman,首次来中国就被弹幕追问 " 你们是不是抄了 EvoMap"。

他当场澄清:"Hermes 代码仓库存在一年多,直到那些推文出现我才听说 EvoMap,Nous Research 是理念驱动的团队,绝不会抄别人仓库据为己有。"
争议三分钟翻篇,但接下来两个多小时的技术对谈,戳中了 AI 行业被忽视的核心问题:当模型能力趋于收敛,下一个竞争维度在哪里?
AI 卷不动跑分了?下一个战场在这
过去几年,AI 圈比的是参数大小、跑分高低,但 2026 年初 OpenClaw 一夜爆火,连老黄都在摩根士丹利论坛感叹这可能是 " 有史以来最重要的软件 "。所有人突然醒了:模型再强,不会用工具、不能真正干活,就只是个聊天机器人。
一夜之间,行业焦点转向了 Harness —— Agent 的运行框架,包括工具调用编排、记忆管理、Skills 系统、沙箱环境等。OpenAI 在《Harness Engineering》博客里定义得很清楚:" 人类掌舵,智能体执行。"MiniMax Agent 首席架构师阿岛用高达打比方:模型是引擎,Harness 是机甲,光有引擎造不出高达,得有完整外骨骼才能让引擎能力最大化。

人类成了 AI 的瓶颈?工程师被 " 蒸馏 " 成代码
阿岛的工作方式早就变了:去年九十月份起,他不怎么打开 IDE 了,日常同时跑五六个本地 Agent,云端还有十个在沙箱里。" 我发现,人类成了瓶颈。" 他说。工程师构建 Harness 的过程,就是把自己的工作方式蒸馏成 Skill 和代码——目的是让人类去做真正热爱的事,就像发明蒸汽机、电力一样。
MiniMax 在这波浪潮里动作密集:发布首个参与自我迭代的模型 M2.7,推出全球首个云端沙箱 MaxHermes,上线基于 OpenClaw 架构的 MaxClaw,三者形成 "Model+Harness" 双向飞轮:M2.7 优化底层能力,MaxHermes 和 MaxClaw 验证场景需求,再反馈回模型训练。
Model+Harness 双向飞轮:模型自己迭代自己
竞争维度变了:过去比模型聪明,现在比同等 Token 产出多少价值。MiniMax 的解法是让模型专门为 Harness 而生。
M2.7 是 3 月 18 日发布的最新编程模型,也是第一个在训练中深度参与迭代自己的商用大模型。它的自我进化有三个层次:1. 承担公司强化学习团队 30%-50% 日常工作流;2. 自主迭代 Harness 超过 100 轮,评测效果提升 30%;3. 在 MLE Lite 竞赛中得牌率 66.6%,仅次于 Opus-4.6 和 GPT-5.4。在 40 个复杂 Skills 测试中,M2.7 仍保持 97% 的遵循率。

海外开源圈集体站队:中国模型领先
最先认可这套能力的是海外开源圈。Hermes 联合创始人 Teknium 多次在 X 上夸 MiniMax 模型的工具调用、速度和性价比;M2.5、M2.7 发布时,Hermes 第一时间接入,现在 MiniMax 是 Hermes 使用量最高的模型之一。
Hermes 日均 Token 消耗从 20 亿飙到 3000 亿,M2.7 在 OpenRouter 上日均消耗超 250 亿。OpenClaw 创始人 Peter 连发五条推文称 MiniMax 是最好的开源模型,M2.1 能以 5% 成本运行 OpenClaw,效果不输顶尖闭源模型。
Notion 联合创始人宣布 M2.5 成为 Notion Custom Agents 首个开源权重模型,Kilo Code 也选它做默认模型。Tommy 在直播中直言:" 中国在开源模型方面已经领先了,开源和闭源从未如此接近。"

养虾养马:AI 智能体自己进化技能
模型和 Harness 的闭环要转起来,得靠产品验证。MiniMax 推了 MaxHermes 和 MaxClaw 两条线:MaxHermes 基于 Hermes Agent,核心是 " 学习闭环 " ——完成任务后自动提炼可复用 Skills,自主迭代,像会举一反三的员工;MaxClaw 基于 OpenClaw,解决本地部署门槛高的问题,上线 120 小时四次扩容,修复 IM 和稳定性问题,预置专家 Skill、50G 云空间,新增图片视频生成工具,还能安全诊断报错。
MiniMax 内部甚至有个数字员工,每天自动扫描开源项目提 PR,用 Agent 推广 Agent 背后的模型,这招在海外社区很管用。
沙箱卡脖子?两大云厂商同时撑腰
Agent 在云端大规模运行,最容易卡住的是沙箱——安全隔离、弹性伸缩的执行环境。
MiniMax 的解法是训练侧找腾讯云,部署侧找阿里云:腾讯云提供 80ms 极速启动、每分钟 60 万沙箱实例,支撑 M2.7 的自主进化训练;阿里云 ACK 承载控制面,ACS 提供 20-40ms 实例供给,每分钟 15000 个沙箱弹性扩缩。两大云厂商同时选 MiniMax 做核心合作伙伴,是对其技术和规模的双重背书。

Token 含金量变了:比的不是数量是价值
MiniMax CEO 闫俊杰提出公式:AI 平台价值 = 智能密度 × Token 吞吐量。过去比参数、跑分,现在比同等 Token 产出的价值。
当两家头部云厂商修路、四个海外开源项目选它做默认模型,这个逻辑已经跑通了。大家最关心的 M3 也有了方向:更大更智能(coding 和办公场景)、原生多模态、价格亲民,让每个人都负担得起 7 × 24 小时的 Agent。
当 AI 不再比谁更聪明,而是比谁更会干活,我们离真正的智能时代又近了一步。你觉得未来的 AI 会是什么样?是能帮你写代码、做 PPT 的数字员工,还是能自主进化的智能体?评论区聊聊你的看法,顺便点个赞让更多人看到 AI 的下一个风口!


登录后才可以发布评论哦
打开小程序可以发布评论哦