MiniMax长成了闫俊杰最需要警惕的样子

文 | 首席人物观，作者 | 二毛

在闫俊杰的认知体系里，一个产品要避免 " 全面优秀 "。简单解释这句话，就是 " 不要把一款产品做成什么都沾一点、什么都不差，但也没有形成一个真正压倒性的东西。"

这不难理解。在创业里，偏科的尖子生，往往比全面发展的中级优等生更容易活下来。

但现在，闫俊杰需要警惕的是，MiniMax 似乎正在成为一个 " 全面优秀 " 的公司——模型能打，价格够低，产品能跑通，商业化也有起色。但这些 " 都不差 " 加在一起，却无法回答市场一个问题：为什么非你不可。

而这，正是 MiniMax 现在最微妙的地方。

01 中级优等生

某种程度上，闫俊杰本人就是一个中级优等生。

他当然聪明。小学阶段就看初中的书，初中时又看高中，高中又自学了微积分。闫俊杰的父亲是一名中学老师，有段时间，还是小学生的闫俊杰就以给爸爸的学生辅导功课为乐。

一般来说，这类人后来通常会有两种走向。要么一路相信自己 " 天赋异禀 "，要么很早就撞见更大的坐标系，知道自己不过是优秀里的普通人。闫俊杰更像后者。

上大学之后，闫俊杰发现周围有同学在数学方面的天分比自己高，" 我不会成为一个很好的数学家了。"

这句话里有一个很重要的分寸：不是不能成为数学家，而是 " 很好的 " 那个位置，大概够不上。

后来的媒体访谈里，他曾表达过 " 做每件事都要做到极致 " 这样的观点，他的参考标准也永远是行业里成就最高的那一个——罗永浩在播客里夸赞 MiniMax 旗下的产品都在行业的第一梯队，他会补充 " 但跟第一还是有差距的 "。跟晚点记者对谈时，对方夸赞他的论文在 Google Scholar 上有接近 3 万次引用，他紧跟一句 " 最 top 的那个人可能是 30 万。"

图注：MiniMax 成立第一天写下的初心和蓝图

这不仅仅是谦虚，更像是不太愿意在一个不够高的标准上停下来。

所以，当他意识到自己在数学上差着那一步时，没有在原地耗太久。转头开始思考另一个问题：什么东西我感兴趣，而且还和数学有关？

泡了一段时间的图书馆后，他找到了答案：人工智能（那时候还叫模式识别）。它离数学足够近，却又不像纯数学那样需要把人与人的差距过早地锁死在天分上。

对闫俊杰来说，这几乎是一种很早就形成的路径选择：在最吃天赋的位置上认清自己，然后退半步，换到一个仍与核心问题相连，却更奖励勤奋、耐力和工程能力，也更有机会实现突围的战场继续往前。

闫俊杰后来长期用过一个名字：IO。那是《DOTA2》里的一个英雄，上帝小精灵。这个英雄原本更常被放在辅助位，负责连线、补给、提速，不是传统意义上一眼看过去最锋利、最像主角的英雄。

但 2019 年 TI 决赛上，Ana 把 IO 拿去打核心位，这让他们战队得到了那年的冠军。闫俊杰说当时觉得这个名字很酷，就拿来用了。

这个偏好放在他身上多少有点意思。因为想把 IO 玩得好，必须具备的素养里包括：全局意识，节奏判断，冷静思考，以及对于团队的理解和组织能力，而闫俊杰身上就有类似的味道。

这一定程度上解释了：为什么这个中级优等生可以在 " 天才如林 " 的 AI 圈里杀出重围。

02 承接

就技术单点突破而言，闫俊杰未必超越了 " 天才 "，但在一件更难的事上，闫俊杰跑到了一些 " 天才叙事 " 前面：他走通了 " 自研 Foundational Model+C 端 Agent 应用（如 Talkie/ 星野）+ 全球市场验证与变现 " 的路径，是目前亚洲大模型公司中，少数被证实拥有规模化全球收入的玩家。

财报显示：MiniMax 2025 年总收入 7900 万美元，同比增长 158.9%，其中 AI-native 产品收入 5310 万美元，开放平台和企业服务收入 2600 万美元，同比增长 197.8%；全年超过 70% 收入来自海外，累计服务了 2.36 亿用户和 21.4 万企业客户及开发者。

确立这样的 " 全局意识 "，源自于闫俊杰在商汤时的经历：

中科院博士毕业后，闫俊杰以实习生身份加入刚刚起步的商汤，仅用了两年多时间，不到 28 岁的闫俊杰就完成了从实习生到商汤科技研究院副院长的身份跃迁，更是主掌了商汤最核心、最庞大的 " 智慧城市 " 安防业务，也是在这个过程里，闫俊杰意识到"产品与技术同行 " 的必要性：

商汤的人脸识别、图像理解、AR 技术，都曾是行业里最能打的那一批。到 2021 年，商汤对外披露，其 AR 技术在全球合作应用中的日活用户规模已经达到约 1 亿，微博、B 站、小红书都在用它。

图注：闫俊杰（左一）在 CVPR 沙龙活动现场

问题是，这 1 亿日活不属于商汤，而属于那些真正拥有产品、流量和用户关系的平台。商汤提供的是能力，但能力被嵌进别人的产品里之后，用户感知到的往往只是 " 这个功能很好用 "，而不是 " 这是商汤做的 "。

" 如果没有足够好的产品能力来承接，即使你有了一些技术进展，这些东西最终也不是你的。" 闫俊杰生出这样的感慨。

除此之外，没有产品承接，公司的生存也将面临挑战。

智慧城市的业务很重，链条很长，交付复杂，技术看上去落进了真实世界，但商业上却并不好看。

根据商汤 2025 年上半年财报，商汤称加强了收款管理。公司称，大部分历史收入来自智慧城市业务，按账龄看，超过 3 年的贸易应收账款为 39.97 亿元，较去年年底的 38.21 亿元改善不大，2 至 3 年的应收账款由去年年底的 17.48 亿元降至 10.08 亿元，2 年以下的应收账款数额稍有上升。总起来，2025 年年中的贸易应收账款为 65.97 亿元，较 2024 年底的 69.74 亿元稍有下降——聊胜于无的下降。

投资人圈子里曾经对 " 商汤系 " 创业者（如闫俊杰、Vivix AI 的刘宇等）有一个高度统一的评价：他们身上没有那种纯学者的清高，反而对 " 搞钱 "、做产品和精细化运营有着近乎狂热的执念——

缺钱的苦，吃一次就够够的了。

所以到了 MiniMax，这几乎成了闫俊杰重新定方向时最先修正的一件事：大模型和产品必须同时发力，技术不能悬在半空里，必须落到用户能感知的产品上。不仅要让产品把模型接住，同时公司还具备造血能力。

2023 年，在高瓴的牵线下，前今日头条用户产品负责人张前川加入 MiniMax，" 字节基因 " 让这位产品经理人深谙流量变现，用户下沉心理、买量漏斗以及在产品里植入极其世俗的 " 抽卡（Gacha）" 系统。

那也是 MiniMax 产品化动作最密集的一段时间：Talkie 在海外长期是买量大户，投放素材累计突破 10 万条；到 2024 年底，星野甚至一度登上 AI App 买量素材榜日榜第一。

这条路走到最用力的时候，MiniMax 甚至像一家重新长在大模型上的互联网公司。到 2025 年前九个月，MiniMax 面向个人用户的 AI 原生产品已经贡献了约 71.1% 的收入，第二大收入源甚至直接来自 Talkie/ 星野的广告。

03 回调

但闫俊杰并没有在这条路上一直走下去，或者更准确地说，他很快又意识到，产品和增长这套东西一旦跑顺，公司就会在不知不觉中滑向另一种叙事：不是模型驱动产品，而是产品反过来定义公司。

" 通过模型能力推动产品和业务变好，和通过移动互联网时代的经典打法让它变好，这两条路可能都是对的，但没法共存。"

这不难理解。因为它们争的是同一个方向盘：技术驱动是模型定义产品，产品驱动则是增长和运营反过来定义模型。两条路都能带来增长，但资源、节奏和判断标准完全不同，放在一家公司里，最后只会彼此拉扯。

一个曾经的失误后来被他反复提起：

2022 年底，Glow 出现了一个很小的算法 bug，它把对话体验拉低约 15%，直接导致 DAU 在三天里就掉了 40%；问题修回来之后，用户又很快回来。这让闫俊杰认识到：在这一阶段，决定产品生死的，往往还是模型本身。

当然，最狠的冲击还是来自于同行。

2025 年，没有大模型公司能逃过 DeepSeek 的冲击，MiniMax 也深刻感受到了 " 震感 "。DeepSeek 用 MoE、极致工程优化和开源，把 " 更低成本也能逼近顶级能力 " 这件事做成了现实。原来那套靠高价 API 和产品想象力支撑起来的安全感，被它一下子打穿了。

与此同时，MiniMax 早期依靠 Glow、Talkie/ 星野跑通的 " 产品反哺模型 " 模式，也开始显出边际——情感陪伴和闲聊数据可以让模型更像人，却很难继续把代码、推理、agent 这些决定下半场位置的能力往上抬。

换句话说，前一阶段产品能把公司托起来，到了下一阶段，真正决定你还能不能留在牌桌上的，还是模型本身。

闫俊杰再次校准，重新聚焦技术驱动。他一边公开承认海螺文本 " 没有坚持技术驱动 "，年初定目标时还在套用移动互联网的逻辑；一边把 M2.5 这类主打 coding、agent 和低成本调用的模型推到台前。

而这次校准的代价，也很快反映在产品侧的人事上。

2024 年 9 月，星野及海外版 Talkie 的产品负责人张前川淡出日常管理，转任顾问；2025 年初，负责商业化的副总裁魏伟离职，官方的说法是 " 国内 B 端业务进入新的发展阶段 "；再往后，连核心模型研发骨干也陆续出现变动。

几件事放在一起看，时间点并不随机：它们几乎都发生在 MiniMax 开始重新把重心收回技术、收回底层、收回模型之后。

如果说前一个阶段，MiniMax 需要的是能把产品跑起来、把流量做起来、把商业化做出来的人，那么这次校准之后，公司要的就不再是这些。当前端产品的边际开始显现，传统 To-B 的销售逻辑又被 DeepSeek 式的低价和开源冲得站不住脚，原来那套围绕 C 端爆发和 B 端兜售所配置的人，自然就开始失去位置。

人事变动不只是结果，它本身就是路线变化的一部分：当闫俊杰决定把公司重新拉回技术驱动，那些不再匹配这套新系统的角色，也就只能被系统本身一点点排出去。

这些是战略层面的校准，当然，闫俊杰在 MiniMax 里做的，远不止是 " 产品驱动 " 与 " 技术驱动 " 的来回切换，他更习惯把这种校准一路做到底层去：

早期 MiniMax 做得还是数字人方向，后又转向了多模态和基础模型；别人还在 dense 上反复打磨时，他押了当时并不算主流的 MoE；再往后，MiniMax 内部一度尝试过更省算力的 Linear Attention，最后发现这条路在复杂任务上撑不住，又硬生生校准回 Full Attention。

图注：MiniMax 各产品线的发布时间

很多时候，他不是在选择一条已经被证明正确的路，而是在不断试错、不断回撤、不断把公司从一个局部最优里拽出来。

这套动作单独看都没有问题，甚至都很像一个技术出身的创始人应有的敏锐：方向偏了就修，架构错了就换，组织不匹配就调整。只是当这些校准一次次叠上去，MiniMax 也慢慢长出了另一种样子——

它几乎在每一个关键节点上都做了正确的事：模型上，M2.7 已经站进国内第一梯队，价格还打得足够低；产品上，Talkie/ 星野、海螺都跑出过成绩，C 端收入和全球化也不难看；商业化上，B 端从 2024 年的 870 万美元增至 2025 年的 2600 万美元，同比增长 197.8%，增速快于 C 端 AI-native 产品收入的 143.4%，且公司还在主动补平台能力；战略上，它既做多模态，也做开放平台，既懂产品化，也重新收回技术驱动。

问题正在这里：这些优点单拎出来都成立，放在一起却没有长成一个压倒性的 " 第一 "。在今天这个越来越奖励单点极致、奖励 " 偏科尖子生 " 的行业里，这种状态最危险的地方就在于：你几乎什么都能参与，却很难成为任何一场关键竞争里的唯一答案。

而这，恰恰是闫俊杰原本最该警惕的状态。

04 " 全面优秀 "

a16z（顶级风险投资公司，以投资包括 Facebook、Twitter、Airbnb 以及众多前沿科技企业而闻名）在 2025 年对 100 位 CIO（首席信息官）的调研里写得很直接：企业采购正在越来越像传统软件采购，买方会更严格地看评测、托管和 benchmark，而不是只看价格；

同一份调研还提到，企业如今更成熟地 " 混用多个模型 "，按性能和成本共同优化。

到了 2026 年初，a16z 又给出一组更关键的数据：54% 的受访者认为 reasoning models（推理模型）加速了 LLM 采用，原因不是便宜，而是更快见效、更少 prompt engineering、更容易接进内部系统，也因为准确性和可解释性而更值得信任。

在这种采购逻辑下，企业往往更愿意为 " 偏科但顶尖 " 的模型买单——把推理、代码、多模态等不同赛道的尖子生分别纳入体系，整体成本未必贵出多少，却能拼出一支性能近乎无短板的 " 模型舰队 "；

相比之下，主打便宜、各项都不错但没有一项绝对领先的中等优等生，处境反而最尴尬—— MiniMax 刚好就有这样的尴尬。

目前为止，MiniMax 最容易被市场记住的，是性价比。

我们横向比较几家主流模型的 API 定价：MiniMax M2.7/M2.5 的报价是输入 0.3 美元、输出 1.2 美元 / 百万 tokens，明显低于 OpenAI GPT-5.4 的 2.5/15 美元、Claude Sonnet 4.6 的 3/15 美元、Kimi K2.5 的 0.6/3 美元，也低于智谱 GLM-5-Turbo 的 5/22 元人民币；它虽然不比 DeepSeek-chat 的 0.27/1.10 更低，但已经稳稳打进了第一梯队。

再看模型能力：

Artificial Analysis（AI 基准测试和分析平台，被称为独立 AI 测试的黄金标准）上，MiniMax M2.7 的 Intelligence Index（智能指数）是 50，和智谱 GLM-5 持平，比 Kimi K2.5 的 47 略高，但仍低于 Claude Sonnet 4.6 自适应版的 52，以及 GPT-5.4、Gemini 3.1 Pro 的 57。

图源：MiniMax M2.7 使用文档

往下一档，M2.5 的 Intelligence Index 只有 42，基本就是和 GLM-4.7、DeepSeek V3.2 同一区间；再往前一代，M2.1 是 39，被 GLM-4.7 的 42、DeepSeek V3.2 的 41 压住，更麻烦的是，M2.5 虽然 agentic 表现提升，但它的 AA-Omniscience（Artificial Analysis 用于评估模型在跨领域知识上的事实准确性和自我认知能力）指数从 -30 掉到 -41，幻觉率回升到 88%；

到了视频端，Hailuo 2.3 在 Artificial Analysis 的文生视频榜排第 23、老的 T2V-01 甚至排到第 49, 离可灵、SkyReels 这些头部还有距离 ; 图生视频榜排第 20，谈不上头部统治力。

也就是说，除了 M2.7（3 月 18 日刚刚发布）这种少数单点突破之外，整个模型家族在文本、视频等主赛道里更多时候只是处在第一梯队边缘，很少形成持续、稳定、跨代际的领先。

大模型行业注定会是一场全球性的竞争，且 MiniMax 成立之初就确定了要走 " 国际化 " 路线，仅这一点就注定了它强敌环伺，没有 " 绝对主线优势 "，便意味着很难同时拿到用户心智、商业定价权、资源配置权和长期生存空间。

MiniMax 能够通过优化 MoE 架构，将 M2.5/M2.7 模型的混合定价强行压制到极低水平，这确实是极其优秀的工程胜利。但在当前极其透明的学术与开源生态下，这种工程优化的保密周期极短。

Artificial Analysis 的报告显示，2025 年 Q3，40+ intelligence index 区间的模型推理价格普遍下降了约 50% 或更多，而且模型还在同时变得更智能、更快，这意味着 " 便宜 " 本身的半衰期极短。

Menlo Ventures（一家硅谷风险投资公司，领投了 Anthropic）数据显示，Anthropic、OpenAI、Google 三家已经占到 88% 的企业 LLM API 使用份额，说明客户最终会把预算集中给那些 " 更强、更稳、更适配场景 " 的头部玩家，而不是长期奖励一个单纯靠低价取胜的供应商。

图注：企业 LLM API 使用份额

这提醒闫俊杰：工程能力当然重要，但到了下半场，真正决定位置的，还是技术能力本身。

闫俊杰在商汤时打过一场攻坚战：

那是商汤的人脸识别项目，他的起手并不漂亮。每次技术测试，他的成绩都排在后面，相当于考试时总考倒数，" 而且当时公司最多的资源都是支持我来做这件事，" 他说。对于一个优等生而言，这个过程中的压力与痛苦可想而知。

死磕了一年半，闫俊杰把这个项目做到了行业第一，并且在之后的每一次测试里，他的第一都巍然不动。

或许这就是他的做事方式：路一旦选定，接下来就是往里走，走到头。

闫俊杰今年 37 岁了，刨除掉漫长的求学生涯，" 工程师 " 的身份伴随了他 7 年，后来，他又以 " 创业者 " 的身份存在了 4 年。罗永浩曾问他喜欢管理吗？闫俊杰的答案是这样的：不喜欢，因为管理带来的杠杆太低了，而做一些有突破的东西带来的杠杆更高，所以我不喜欢管理，但喜欢研究组织。

学者的内啡肽来自于‘突破’，但企业家讲究回报率。从这个角度看，闫俊杰显然已经具备了企业家的属性：他依然相信技术，依然迷恋突破，但已经不再满足于把问题解出来，而是开始要求这些答案最终变成产品、收入、组织和市场位置。

只不过，MiniMax 能不能因此逃开 " 全面优秀 " 的陷阱，仍然是另一道更难的题。

宙世代

一起剪

相关标签