不能只算token账

文 | 象先志

Anthropic 禁止订阅用户通过龙虾等第三方工具接入后，小米大模型团队负责人罗福莉凌晨发了篇帖子讨论这事。

主要内容可以概括为两点。

第一，A 社的做法虽然会短期推高使用成本，如果用户继续使用 Claude 模型，但长期来看会带来很好的工程纪律。

工程纪律的意思是，社区会因为模型成本上升，在开发产品时做更合理的工程优化来提升 token 的使用效率。

这里她点名批评了龙虾，上下文管理做得很拉胯，一个用户请求会触发多轮工具调用，每次都是携带长上下文的独立 API 请求。

第二，她呼吁模型厂商不要打价格战，不要靠低价吸引用户入坑后，又用缩水的模型和不稳定的服务去损害体验。

我们前两天写了篇文章，《小米这次也没把价格打下来》，其中提到 MiMo Token Plan 目前价格相对其他厂商同等套餐偏贵。

罗福莉没有直接承认这点，但间接回答了这个问题：小米的目标是 " 长期稳定地交付高质量的模型和服务 —— 而不是让你冲动付款，然后弃船。"

我们之前文章里提到，MiMo 套餐偏贵的事实其实跟小米给大众的主流印象是有差距的，毕竟观众更熟悉性价比叙事。

但这也不是小米搞 AI 后就变了，小米这个定价肯定也谈不上赚钱，只是在其他选手亏损搞 token 倾销的时候，选择了更贴近成本的定价策略。

token 倾销这个词可能有点重，因为要是以低于成本售卖 AI 服务这个标准看，目前行业里基本没谁能逃得过。

但有些玩家定价的确相当激进，低价吸引用户过来后保证不了体验，比如我就遇到过某家套餐服务卡顿甚至不可用的情况。

大模型跟其他传统互联网产品不同。传统互联网产品边际成本可以不计，用户翻倍成本增加很少。大模型产品成本跟用户规模比例扩张。

而且还因为是非标品，厂商很容易在背后做手脚，稍微降点智用户不容易察觉，察觉到也没有实际证据。

当然，即便存在这些一些问题，我仍然认为模型厂商价格战是利大于弊的，是双赢的局面。

用户客观上因为价格战得到了便宜，这是加速新技术采纳的决定性因素。

DeepSeek 去年的模型并没有在能力上超过 GPT 或者 Claude，但 R1 的意义仍然没有被高估，因为把成本降低几十倍对技术普及的促进必然强于某个增量 SOTA 模型。

至于亏钱卖 token 不可持续，我只能说不是现阶段二线厂商配考虑的问题。

Anthropic 模型能力顶尖，产品体验差异化，所以哪怕经常封号拔网线也一堆用户求着交钱。

彭博上个月报道，Anthropic 当时年化收入已经达到 200 亿美元，相比去年底翻倍还多，这个夸张的增长速度隐隐有取 OpenAI 而代之的意思了。

但二线厂商之间模型能力并没有拉开差距，不同厂商轮流领先，性价比是不得不走的路子。

罗福莉评价是对的，龙虾就是 vibe coding 出来的一堆屎山。

因为是屎山，所以它没有架构设计，没有工程优化，天生就浪费效率。

但它能火起来，能让一堆专业的非专业的用户愿意用，就已经算是功德无量了。

所有二线厂商都应该给龙虾磕一个，我很难想象没有龙虾他们得多努力才能证明自己的价值。

这是 OpenRouter 上不同模型的使用统计。

在龙虾火爆之前，你在这个排行里根本看不到二线模型厂商，除了硅谷御四家，其余全是 others。

但现在排行榜前几名，已经被阿里、小米、阶跃星辰的模型占满了。

话说新模型出来，免费放 OpenRouter 上吸引大家用一用，已经成为国内厂商的惯例。OpenRouter 现在已经沦为 PR 前沿阵地。

这两天阿里发布 Qwen3.6，宣传登上 OpenRouter 排行榜首。小米 MiMo 之前也宣传登顶了 OpenRouter。都是免费试用。

某种程度上说，龙虾耗 token 甚至可以理解成是 feature。

大模型研发门槛很高，但大模型供给一直以来都是不稀缺的，因为用户不需要那么多模型。龙虾把性价比放大成了真正的竞争力。

简单拉下数据。MiniMax 去年总收入 7900 万美元，龙虾爆火后 2 月 ARR 已超 1.5 亿美元。月之暗面发布 K2.5 模型后，不到 20 天收入超去年全年，且海外收入首次超过国内。

AI 的确在推动各个产业发生变革，不过就 AI 自身而言，至今为止都还没有跑通独立的盈利模式。OpenAI 和 Anthropic 收入在快速增长，但能否覆盖巨额研发和资本支出仍有疑问。

至于智谱、MiniMax 和月之暗面们，距离闭环的商业模式就更为遥远了。

这种情况下，叙事成为生存的要义。叙事不能只靠画饼，模型厂商的第一性原理就是模型得有人用。

没人用，叙事就崩塌了。有人用，越来越多人用，叙事才会变得圆满。

去年底，月之暗面估值 43 亿美元，现在正以 180 亿美元寻求融资，翻了四倍不止。智谱今天收盘 780 港币，是 1 月份 IPO 发行价 116 港币的 6.7 倍。MiniMax 的 IPO 发行价是 165 港币，现在股价是 950，也是翻了快 6 倍。

不能只算 token 账。

二线模型厂商在成本和规模压力下，已经有提价动作。但这暂时不会达到摆脱价格战的地步。

小米的处境比较特殊，它有自己完整的产品矩阵和硬件生态，MiMo 的第一使命是融入并改造这个现有生态。哪怕不对外卖 token，小爱同学、智能手机、小米汽车、IoT 设备生态，MiMo 都能有大有作为的空间。

智谱、MiniMax、月之暗面们则处在另一个处境。它们有 C 端产品，但这个赛道竞争极其惨烈。目前看来独立的 AI 产品，无论是通用助手，还是细分赛道，字节、腾讯和阿里都有碾压性的优势，也有争夺的意志。

相较之下，API 卖 token 的生意看起来好一些，虽然好得有限。因为这只关乎模型质量，而腾讯和 Meta 的经验表明，模型研发不只是钱和资源的因素。

但龙虾窗口期不会无限延续。

如果龙虾只是一阵风，过段时间随风而逝，那自然二线厂商也就不能指望这个出货渠道了。

如果龙虾代表的不是一个工具的短暂流行，而是 C 端 AI 产品的一种范式，那大科技公司一定会出手。

这些公司有流量、有分发、有用户信任，它们会以自己的竞品收割市场，并且会优先使用自己训练的模型，而不是采购二线厂商的 API。

模型跟产品的结合是大趋势。阿里打通千问 App 跟通义模型研发团队，搞出了组织调整和人事出走风波。姚顺雨入职腾讯，也是首先做团队整合，不同研发部门之间的整合以及研发跟产品的整合。

罗福莉批评龙虾耗 token，提到 Claude Code 更节省上下文的工程设计，这是另一个产品需要跟模型打通的案例。

龙虾架构上的天然缺陷，意味着每次工具调用都携带完整的长上下文发起独立请求，用户的一个操作可能在后台触发十几轮 API 调用。这不仅烧 token，也制造延迟，制造不稳定。

Claude Code 对上下文做精细管理，知道什么时候该压缩历史，什么时候该截断，怎么在保留任务状态的同时减少冗余信息的传递。

这背后是 Anthropic 对自己模型能力边界的深刻理解。只有模型研发者，才能把产品和模型调优成浑然一体的东西。

AI 产品的第一代范式是，模型作为通用 API，产品套在外面。这个范式催生了龙虾，也催生了无数套壳应用。它降低了创业门槛，但也带来了巨大的效率浪费。产品不理解模型，模型不适配产品，两边都在用蛮力弥补彼此的信息差。

如今第二代范式正在浮现：模型与产品深度整合，从架构层面共同设计。Claude Code 是一个样本：模型不再是被调用的服务，而是产品本身的一部分。

这个趋势下，纯粹的模型 API 厂商面临的压力会越来越大，没有产品可能成为它们的致命缺陷。如果竞争力来自模型与应用层的深度整合，那 API 层的价格竞争就是一场慢性消耗。

行业一直喜欢说模型即产品，用这句话强调模型的基础作用和重要性没问题。但除非你的商业模式是只卖 API，否则模型始终是产品的组成部分，而不是产品的全部。

宙世代

一起剪

相关标签