钛媒体 6小时前
MiniMax长成了闫俊杰最需要警惕的样子
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

文 | 首席人物观,作者 | 二毛

在闫俊杰的认知体系里,一个产品要避免 " 全面优秀 "。简单解释这句话,就是 " 不要把一款产品做成什么都沾一点、什么都不差,但也没有形成一个真正压倒性的东西。"

这不难理解。在创业里,偏科的尖子生,往往比全面发展的中级优等生更容易活下来。

但现在,闫俊杰需要警惕的是,MiniMax 似乎正在成为一个 " 全面优秀 " 的公司——模型能打,价格够低,产品能跑通,商业化也有起色。但这些 " 都不差 " 加在一起,却无法回答市场一个问题:为什么非你不可。

而这,正是 MiniMax 现在最微妙的地方。

01  中级优等生

某种程度上,闫俊杰本人就是一个中级优等生。

他当然聪明。小学阶段就看初中的书,初中时又看高中,高中又自学了微积分。闫俊杰的父亲是一名中学老师,有段时间,还是小学生的闫俊杰就以给爸爸的学生辅导功课为乐。

一般来说,这类人后来通常会有两种走向。要么一路相信自己 " 天赋异禀 ",要么很早就撞见更大的坐标系,知道自己不过是优秀里的普通人。闫俊杰更像后者。

上大学之后,闫俊杰发现周围有同学在数学方面的天分比自己高," 我不会成为一个很好的数学家了。"

这句话里有一个很重要的分寸:不是不能成为数学家,而是 " 很好的 " 那个位置,大概够不上。

后来的媒体访谈里,他曾表达过 " 做每件事都要做到极致 " 这样的观点,他的参考标准也永远是行业里成就最高的那一个——罗永浩在播客里夸赞 MiniMax 旗下的产品都在行业的第一梯队,他会补充 " 但跟第一还是有差距的 "。跟晚点记者对谈时,对方夸赞他的论文在 Google Scholar 上有接近 3 万次引用,他紧跟一句 " 最 top 的那个人可能是 30 万。"

图注:MiniMax 成立第一天写下的初心和蓝图

这不仅仅是谦虚,更像是不太愿意在一个不够高的标准上停下来。

所以,当他意识到自己在数学上差着那一步时,没有在原地耗太久。转头开始思考另一个问题:什么东西我感兴趣,而且还和数学有关?

泡了一段时间的图书馆后,他找到了答案:人工智能(那时候还叫模式识别)。它离数学足够近,却又不像纯数学那样需要把人与人的差距过早地锁死在天分上。

对闫俊杰来说,这几乎是一种很早就形成的路径选择:在最吃天赋的位置上认清自己,然后退半步,换到一个仍与核心问题相连,却更奖励勤奋、耐力和工程能力,也更有机会实现突围的战场继续往前。

闫俊杰后来长期用过一个名字:IO。那是《DOTA2》里的一个英雄,上帝小精灵。这个英雄原本更常被放在辅助位,负责连线、补给、提速,不是传统意义上一眼看过去最锋利、最像主角的英雄。

但 2019 年 TI 决赛上,Ana 把 IO 拿去打核心位,这让他们战队得到了那年的冠军。闫俊杰说当时觉得这个名字很酷,就拿来用了。

这个偏好放在他身上多少有点意思。因为想把 IO 玩得好,必须具备的素养里包括:全局意识,节奏判断,冷静思考,以及对于团队的理解和组织能力,而闫俊杰身上就有类似的味道。

这一定程度上解释了:为什么这个中级优等生可以在 " 天才如林 " 的 AI 圈里杀出重围。

02  承接

就技术单点突破而言,闫俊杰未必超越了 " 天才 ",但在一件更难的事上,闫俊杰跑到了一些 " 天才叙事 " 前面:他走通了 " 自研 Foundational Model+C 端 Agent 应用(如 Talkie/ 星野)+ 全球市场验证与变现 " 的路径,是目前亚洲大模型公司中,少数被证实拥有规模化全球收入的玩家。

财报显示:MiniMax 2025 年总收入 7900 万美元,同比增长 158.9%,其中 AI-native 产品收入 5310 万美元,开放平台和企业服务收入 2600 万美元,同比增长 197.8%;全年超过 70% 收入来自海外,累计服务了 2.36 亿用户和 21.4 万企业客户及开发者。

确立这样的 " 全局意识 ",源自于闫俊杰在商汤时的经历:

中科院博士毕业后,闫俊杰以实习生身份加入刚刚起步的商汤,仅用了两年多时间,不到 28 岁的闫俊杰就完成了从实习生到商汤科技研究院副院长的身份跃迁,更是主掌了商汤最核心、最庞大的 " 智慧城市 " 安防业务,也是在这个过程里,闫俊杰意识到"产品与技术同行 " 的必要性:

商汤的人脸识别、图像理解、AR 技术,都曾是行业里最能打的那一批。到 2021 年,商汤对外披露,其 AR 技术在全球合作应用中的日活用户规模已经达到约 1 亿,微博、B 站、小红书都在用它。

图注:闫俊杰(左一)在 CVPR 沙龙活动现场

问题是,这 1 亿日活不属于商汤,而属于那些真正拥有产品、流量和用户关系的平台。商汤提供的是能力,但能力被嵌进别人的产品里之后,用户感知到的往往只是 " 这个功能很好用 ",而不是 " 这是商汤做的 "。

" 如果没有足够好的产品能力来承接,即使你有了一些技术进展,这些东西最终也不是你的。" 闫俊杰生出这样的感慨。

除此之外,没有产品承接,公司的生存也将面临挑战。

智慧城市的业务很重,链条很长,交付复杂,技术看上去落进了真实世界,但商业上却并不好看。

根据商汤 2025 年上半年财报,商汤称加强了收款管理。公司称,大部分历史收入来自智慧城市业务,按账龄看,超过 3 年的贸易应收账款为 39.97 亿元,较去年年底的 38.21 亿元改善不大,2 至 3 年的应收账款由去年年底的 17.48 亿元降至 10.08 亿元,2 年以下的应收账款数额稍有上升。总起来,2025 年年中的贸易应收账款为 65.97 亿元,较 2024 年底的 69.74 亿元稍有下降——聊胜于无的下降。

投资人圈子里曾经对 " 商汤系 " 创业者(如闫俊杰、Vivix AI 的刘宇等)有一个高度统一的评价:他们身上没有那种纯学者的清高,反而对 " 搞钱 "、做产品和精细化运营有着近乎狂热的执念——

缺钱的苦,吃一次就够够的了。

所以到了 MiniMax,这几乎成了闫俊杰重新定方向时最先修正的一件事:大模型和产品必须同时发力,技术不能悬在半空里,必须落到用户能感知的产品上。不仅要让产品把模型接住,同时公司还具备造血能力。

2023 年,在高瓴的牵线下,前今日头条用户产品负责人张前川加入 MiniMax," 字节基因 " 让这位产品经理人深谙流量变现,用户下沉心理、买量漏斗以及在产品里植入极其世俗的 " 抽卡(Gacha)" 系统。

那也是 MiniMax 产品化动作最密集的一段时间:Talkie 在海外长期是买量大户,投放素材累计突破 10 万条;到 2024 年底,星野甚至一度登上 AI App 买量素材榜日榜第一。

这条路走到最用力的时候,MiniMax 甚至像一家重新长在大模型上的互联网公司。到 2025 年前九个月,MiniMax 面向个人用户的 AI 原生产品已经贡献了约 71.1% 的收入,第二大收入源甚至直接来自 Talkie/ 星野的广告。

03  回调

但闫俊杰并没有在这条路上一直走下去,或者更准确地说,他很快又意识到,产品和增长这套东西一旦跑顺,公司就会在不知不觉中滑向另一种叙事:不是模型驱动产品,而是产品反过来定义公司。

" 通过模型能力推动产品和业务变好,和通过移动互联网时代的经典打法让它变好,这两条路可能都是对的,但没法共存。"

这不难理解。因为它们争的是同一个方向盘:技术驱动是模型定义产品,产品驱动则是增长和运营反过来定义模型。两条路都能带来增长,但资源、节奏和判断标准完全不同,放在一家公司里,最后只会彼此拉扯。

一个曾经的失误后来被他反复提起:

2022 年底,Glow 出现了一个很小的算法 bug,它把对话体验拉低约 15%,直接导致 DAU 在三天里就掉了 40%;问题修回来之后,用户又很快回来。这让闫俊杰认识到:在这一阶段,决定产品生死的,往往还是模型本身。

当然,最狠的冲击还是来自于同行。

2025 年,没有大模型公司能逃过 DeepSeek 的冲击,MiniMax 也深刻感受到了 " 震感 "。DeepSeek 用 MoE、极致工程优化和开源,把 " 更低成本也能逼近顶级能力 " 这件事做成了现实。原来那套靠高价 API 和产品想象力支撑起来的安全感,被它一下子打穿了。

与此同时,MiniMax 早期依靠 Glow、Talkie/ 星野跑通的 " 产品反哺模型 " 模式,也开始显出边际——情感陪伴和闲聊数据可以让模型更像人,却很难继续把代码、推理、agent 这些决定下半场位置的能力往上抬。

换句话说,前一阶段产品能把公司托起来,到了下一阶段,真正决定你还能不能留在牌桌上的,还是模型本身。

闫俊杰再次校准,重新聚焦技术驱动。他一边公开承认海螺文本 " 没有坚持技术驱动 ",年初定目标时还在套用移动互联网的逻辑;一边把 M2.5 这类主打 coding、agent 和低成本调用的模型推到台前。

而这次校准的代价,也很快反映在产品侧的人事上。

2024 年 9 月,星野及海外版 Talkie 的产品负责人张前川淡出日常管理,转任顾问;2025 年初,负责商业化的副总裁魏伟离职,官方的说法是 " 国内 B 端业务进入新的发展阶段 ";再往后,连核心模型研发骨干也陆续出现变动。

几件事放在一起看,时间点并不随机:它们几乎都发生在 MiniMax 开始重新把重心收回技术、收回底层、收回模型之后。

如果说前一个阶段,MiniMax 需要的是能把产品跑起来、把流量做起来、把商业化做出来的人,那么这次校准之后,公司要的就不再是这些。当前端产品的边际开始显现,传统 To-B 的销售逻辑又被 DeepSeek 式的低价和开源冲得站不住脚,原来那套围绕 C 端爆发和 B 端兜售所配置的人,自然就开始失去位置。

人事变动不只是结果,它本身就是路线变化的一部分:当闫俊杰决定把公司重新拉回技术驱动,那些不再匹配这套新系统的角色,也就只能被系统本身一点点排出去。

这些是战略层面的校准,当然,闫俊杰在 MiniMax 里做的,远不止是 " 产品驱动 " 与 " 技术驱动 " 的来回切换,他更习惯把这种校准一路做到底层去:

早期 MiniMax 做得还是数字人方向,后又转向了多模态和基础模型;别人还在 dense 上反复打磨时,他押了当时并不算主流的 MoE;再往后,MiniMax 内部一度尝试过更省算力的 Linear Attention,最后发现这条路在复杂任务上撑不住,又硬生生校准回 Full Attention。

图注:MiniMax 各产品线的发布时间

很多时候,他不是在选择一条已经被证明正确的路,而是在不断试错、不断回撤、不断把公司从一个局部最优里拽出来。

这套动作单独看都没有问题,甚至都很像一个技术出身的创始人应有的敏锐:方向偏了就修,架构错了就换,组织不匹配就调整。只是当这些校准一次次叠上去,MiniMax 也慢慢长出了另一种样子——

它几乎在每一个关键节点上都做了正确的事:模型上,M2.7 已经站进国内第一梯队,价格还打得足够低;产品上,Talkie/ 星野、海螺都跑出过成绩,C 端收入和全球化也不难看;商业化上,B 端从 2024 年的 870 万美元增至 2025 年的 2600 万美元,同比增长 197.8%,增速快于 C 端 AI-native 产品收入的 143.4%,且公司还在主动补平台能力;战略上,它既做多模态,也做开放平台,既懂产品化,也重新收回技术驱动。

问题正在这里:这些优点单拎出来都成立,放在一起却没有长成一个压倒性的 " 第一 "。在今天这个越来越奖励单点极致、奖励 " 偏科尖子生 " 的行业里,这种状态最危险的地方就在于:你几乎什么都能参与,却很难成为任何一场关键竞争里的唯一答案。

而这,恰恰是闫俊杰原本最该警惕的状态。

04  " 全面优秀 "

a16z(顶级风险投资公司,以投资包括 Facebook、Twitter、Airbnb 以及众多前沿科技企业而闻名)在 2025 年对 100 位 CIO(首席信息官)的调研里写得很直接:企业采购正在越来越像传统软件采购,买方会更严格地看评测、托管和 benchmark,而不是只看价格;

同一份调研还提到,企业如今更成熟地 " 混用多个模型 ",按性能和成本共同优化。

到了 2026 年初,a16z 又给出一组更关键的数据:54% 的受访者认为 reasoning models(推理模型)加速了 LLM 采用,原因不是便宜,而是更快见效、更少 prompt engineering、更容易接进内部系统,也因为准确性和可解释性而更值得信任。

在这种采购逻辑下,企业往往更愿意为 " 偏科但顶尖 " 的模型买单——把推理、代码、多模态等不同赛道的尖子生分别纳入体系,整体成本未必贵出多少,却能拼出一支性能近乎无短板的 " 模型舰队 ";

相比之下,主打便宜、各项都不错但没有一项绝对领先的中等优等生,处境反而最尴尬—— MiniMax 刚好就有这样的尴尬。

目前为止,MiniMax 最容易被市场记住的,是性价比。

我们横向比较几家主流模型的 API 定价:MiniMax   M2.7/M2.5 的报价是输入 0.3 美元、输出 1.2 美元 / 百万 tokens,明显低于 OpenAI GPT-5.4 的 2.5/15 美元、Claude Sonnet 4.6 的 3/15 美元、Kimi K2.5 的 0.6/3 美元,也低于智谱 GLM-5-Turbo 的 5/22 元人民币;它虽然不比 DeepSeek-chat 的 0.27/1.10 更低,但已经稳稳打进了第一梯队。

再看模型能力:

Artificial Analysis(AI 基准测试和分析平台,被称为独立 AI 测试的黄金标准)上,MiniMax M2.7 的 Intelligence Index(智能指数)是 50,和智谱 GLM-5 持平,比 Kimi K2.5 的 47 略高,但仍低于 Claude Sonnet 4.6 自适应版的 52,以及 GPT-5.4、Gemini 3.1 Pro 的 57。

图源:MiniMax M2.7 使用文档

往下一档,M2.5 的 Intelligence Index 只有 42,基本就是和 GLM-4.7、DeepSeek V3.2 同一区间;再往前一代,M2.1 是 39,被 GLM-4.7 的 42、DeepSeek V3.2 的 41 压住,更麻烦的是,M2.5 虽然 agentic 表现提升,但它的 AA-Omniscience(Artificial Analysis 用于评估模型在跨领域知识上的事实准确性和自我认知能力)指数从 -30 掉到 -41,幻觉率回升到 88%;

到了视频端,Hailuo 2.3 在 Artificial Analysis 的文生视频榜排第 23、老的 T2V-01 甚至排到第 49, 离可灵、SkyReels 这些头部还有距离 ; 图生视频榜排第 20,谈不上头部统治力。

也就是说,除了 M2.7(3 月 18 日刚刚发布)这种少数单点突破之外,整个模型家族在文本、视频等主赛道里更多时候只是处在第一梯队边缘,很少形成持续、稳定、跨代际的领先。

大模型行业注定会是一场全球性的竞争,且 MiniMax 成立之初就确定了要走 " 国际化 " 路线,仅这一点就注定了它强敌环伺,没有 " 绝对主线优势 ",便意味着很难同时拿到用户心智、商业定价权、资源配置权和长期生存空间。

MiniMax 能够通过优化 MoE 架构,将 M2.5/M2.7 模型的混合定价强行压制到极低水平,这确实是极其优秀的工程胜利。但在当前极其透明的学术与开源生态下,这种工程优化的保密周期极短。

Artificial Analysis 的报告显示,2025 年 Q3,40+ intelligence index 区间的模型推理价格普遍下降了约 50% 或更多,而且模型还在同时变得更智能、更快,这意味着 " 便宜 " 本身的半衰期极短。

Menlo Ventures(一家硅谷风险投资公司,领投了 Anthropic)数据显示,Anthropic、OpenAI、Google 三家已经占到 88% 的企业 LLM API 使用份额,说明客户最终会把预算集中给那些 " 更强、更稳、更适配场景 " 的头部玩家,而不是长期奖励一个单纯靠低价取胜的供应商。

图注:企业 LLM API 使用份额

这提醒闫俊杰:工程能力当然重要,但到了下半场,真正决定位置的,还是技术能力本身。

闫俊杰在商汤时打过一场攻坚战:

那是商汤的人脸识别项目,他的起手并不漂亮。每次技术测试,他的成绩都排在后面,相当于考试时总考倒数," 而且当时公司最多的资源都是支持我来做这件事," 他说。对于一个优等生而言,这个过程中的压力与痛苦可想而知。

死磕了一年半,闫俊杰把这个项目做到了行业第一,并且在之后的每一次测试里,他的第一都巍然不动。

或许这就是他的做事方式:路一旦选定,接下来就是往里走,走到头。

闫俊杰今年 37 岁了,刨除掉漫长的求学生涯," 工程师 " 的身份伴随了他 7 年,后来,他又以 " 创业者 " 的身份存在了 4 年。罗永浩曾问他喜欢管理吗?闫俊杰的答案是这样的:不喜欢,因为管理带来的杠杆太低了,而做一些有突破的东西带来的杠杆更高,所以我不喜欢管理,但喜欢研究组织。

学者的内啡肽来自于‘突破’,但企业家讲究回报率。从这个角度看,闫俊杰显然已经具备了企业家的属性:他依然相信技术,依然迷恋突破,但已经不再满足于把问题解出来,而是开始要求这些答案最终变成产品、收入、组织和市场位置。

只不过,MiniMax 能不能因此逃开 " 全面优秀 " 的陷阱,仍然是另一道更难的题。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

罗永浩 数学 高中 初中 辅导
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论