虎嗅APP 11小时前
当AI从租GPU走向卖Token,谁会赚到真正的钱?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

出品 | 妙投 APP

作者 | 张博

编辑 | 丁萍

头图 | AI 生图

过去两年,AI 产业最耀眼的主角是大模型,随后市场的目光迅速转向 " 算力 " ——谁有 GPU、谁有机房、谁能更快把服务器架起来,似乎谁就站在了浪潮前排。

但任何产业往前走一步,底层逻辑都会变一层。

如果说训练大模型更像 " 造发动机 ",那么今天越来越重要的推理服务,更像是让汽车真正跑上路。模型再强,如果不能被稳定、低成本、大规模地调用,就很难真正进入企业、进入场景、进入日常生活。

而推理本质上是一种持续性的算力消耗。用户每一次提问、每一次生成内容,背后都会消耗 Token。随着 AI 应用规模越来越大,行业真正比拼的,也不再只是 " 有没有 GPU",而是谁能更低成本、更稳定地生产和调度 Token。

也正因为如此,AI 算力服务正在发生一场重要变化:过去主流是 " 算力租赁 ",说白了就是租 GPU、租服务器;而现在,新的角色开始浮出水面—— Token 工厂与 Token 运营平台。

这两个词听起来新,但如果换成更通俗的话,其实不难理解。所谓 Token 工厂,就是专门 " 生产 AI 输出能力 " 的工厂,它不只是把机器租给你,而是直接把模型跑起来,按实际输出量收费。所谓 Token 运营平台,则像 AI 时代的 " 模型中转站 " 或 " 统一入口 ",把不同模型、不同服务商整合起来,让企业和开发者更方便地调用。

如果说过去卖的是 " 铲子 ",那么现在越来越多公司想卖的,是 " 挖出来的矿 ";如果说过去比的是 " 谁有机器 ",那么现在比的,是 " 谁能用同样的机器,产出更多、更便宜、更稳定的智能服务 "。

这背后,不只是新概念,而是 AI 产业分工开始深化的信号。更现实的问题是:从卖 GPU 到卖 Token,AI 推理服务到底是不是一门更好的生意?

AI 算力服务为何要发生变化?

因为 " 租算力 " 开始不够用了。

任何新产业在早期,都会经历一个 " 资源稀缺 " 的阶段。AI 也一样。前两年,大家最关心的是有没有高端 GPU,能不能拿到英伟达的卡,能不能尽快把集群搭起来。

于是," 算力租赁 " 成了一个很热的生意:有资源的人把 GPU 服务器租出去,客户按月、按年付费。这个模式在产业早期成立,因为当时最稀缺的是 " 资源本身 "。

但随着 AI 从训练走向推理,这种模式的局限开始暴露。

首先,它更像 " 出租设备 ",而不是 " 交付结果 "。客户租的是 GPU,不是最终的 AI 能力。就像租了一台机器,至于机器最后做出多少产品、赚了多少钱,和出租方关系不大。这意味着,哪怕下游 AI 应用突然爆发,算力租赁方也很难真正分享到增长红利,收入通常是固定的,弹性有限。

其次,它容易陷入同质化竞争。如果大家做的都是" 谁有卡、谁便宜、谁交付快 ",那么这门生意最终很容易走向价格战,利润空间会被持续压缩。

更重要的是,对大模型公司和互联网大厂来说,自己扛着全部推理体系越来越重。今天的大模型服务,已经不是 " 把模型部署上去 " 这么简单,它背后要解决的是机房、电力、散热、网络、存储、调度、模型优化、延迟控制、稳定性保障、成本管理等一整套复杂问题。

对很多大厂来说,算力投入已经不只是技术问题,更是财务问题、组织问题,甚至是风险问题。资本开支太重,运营太复杂,合规要求又越来越高,企业自然会想:有没有一种方式,可以既拿到推理能力,又不用自己事事亲力亲为?

这就像制造业发展到一定阶段,品牌商会把部分生产环节外包给更专业的工厂。AI 产业也正在出现类似的分工。于是,问题不再只是 " 有没有算力 ",而是谁能更高效、更稳定、更低成本地把模型能力转化成 Token,并持续交付给应用和客户?

而这里真正的变化还不只是 " 服务外包 ",更在于计价方式变了,收入逻辑也就变了。

Token 工厂有何吸引力?

所谓 Token 工厂,本质上是一种新的推理服务模式。它有重资产底座——机房、服务器、集群、电力、网络;但它不只是把这些硬件租出去,而是直接承接模型推理任务,生产 Token,并按 Token 消耗收费,甚至和模型方按收入分成。

如果用制造业做类比,它有点像 AI 时代的 " 代工厂 ";如果用能源行业做类比,它也有点像 " 炼油厂 " ——真正决定价值的,不只是有没有原料,而是能不能高效率地加工出有价值的产出。

为什么这个模式更有吸引力?

因为它同时满足了上下游两端的需求。对上游模型厂商来说,可以把一部分推理产能外包出去,自己更专注于模型研发和应用生态;对下游客户来说,不需要自己深度介入复杂的部署和调优,只要通过标准 API 调用,就能拿到稳定的 AI 服务。

对 Token 工厂自己来说,收入不再是固定租金,而是和下游调用量相关,如果 AI 应用越来越普及,Token 消耗越来越多,它就有机会分享到更大的增长空间。

这也是为什么,一些公司披露的 Token 工厂业务毛利率,会显著高于传统算力租赁。传统租赁更像资源生意,而 Token 工厂更接近 " 资源 + 工程优化 + 服务交付 " 的复合型生意。

当然,很多人第一反应会觉得,Token 工厂的壁垒在于 " 卡多 "。但真正往下看,未必如此。因为在推理时代,更关键的问题不是 " 有没有卡 ",而是在同样的卡、同样的电、同样的机房条件下,谁能产出更多 Token?

这背后拼的是一整套工程能力,比如模型压缩和量化能力、推理引擎优化能力、模型与芯片的适配能力、并行调度和资源利用率、自动扩缩容和稳定性保障。全球市场上,推理优化团队越来越受到重视,原因就在这里。因为它们做的事情,本质上是在降低单位 Token 成本。而谁能把成本做低,谁就更有可能在未来的竞争中活下来。

不过,从投资角度看,Token 工厂真正需要回答的,已经不只是 " 有没有效率优势 ",而是这种效率优势能持续多久。

这是一个不能回避的问题。因为推理优化并不是某一家公司的专利,英伟达、模型厂商、开源社区都在快速推进相关工具和框架。今天靠工程优化拿到的领先,明天可能就会被更成熟的通用方案迅速缩小。换句话说,这种壁垒更像动态领先,而不是静态护城河。

另一个值得警惕的地方,是客户关系的双重性。表面上看,绑定字节、阿里、腾讯这样的头部客户当然是优势;但反过来看,这些客户本身也是最强的技术公司。

它们今天向外采购 Token 工厂服务,可能是因为当下需要补充波峰算力、优化组织效率、转移部分资本开支;可一旦自身推理成本降得足够低,或者内部体系更成熟,外部工厂还能拿到多大的长期价值,就需要重新评估。

所以,Token 工厂确实是一种更先进的产业分工,但这并不意味着它天然就是一门高壁垒、高回报的生意。从投资上看,它更像 "AI 时代的重资产基础设施 " ——收入看得见,订单也可能看得见,但最后能不能沉淀为高回报,还要看产能利用率、折旧周期、持续再投资压力,以及最关键的:它到底有没有定价权。

如果上游模型厂商持续降价,下游客户又越来越强势,那么 Token 工厂即便能保持较高毛利率,也未必一定能创造足够好的资本回报。这一点,远比单纯讨论毛利率更值得重视。

Token 运营平台的价值在哪?

如果说 Token 工厂解决的是 " 生产问题 ",那么 Token 运营平台解决的就是 " 流通问题 "。

今天的 AI 模型越来越多,不同模型有不同能力、不同价格、不同接口。对于开发者和企业来说,真正麻烦的往往不是 " 没有模型可用 ",而是 " 模型太多、接口太散、服务不够稳定 "。

于是,Token 运营平台的价值开始出现。它做的事情,可以用一句很通俗的话概括:把复杂的模型世界,变成一个更简单、更好用的服务入口。

这类平台真正的价值,不只是 " 聚合 ",而在于三件事:降低接入门槛;提供稳定性保障;做智能路由,让不同任务匹配不同模型,在效果和成本之间找到最优解。

所以,Token 运营平台并不只是 " 中间商 ",它更像 AI 时代的 " 流量调度中心 "。从商业模式看,这类平台通常比较轻资产,收入主要来自在上游价格基础上的服务溢价。它的长期价值,不在于赚多少差价,而在于能不能形成平台效应和客户粘性。

但这里同样存在一个容易被忽略的问题:谁才是企业客户真正的入口?

在很多 B 端场景里,企业本来就已经深度绑定某一家云厂商。它的账户体系、数据体系、运维体系、合规体系,往往都建立在云平台之上。对于这类客户来说,模型调用天然会优先选择云厂商自己的 MaaS 平台,而不是再额外引入一个独立的 Token 运营商。

这意味着,独立 Token 运营平台想要成立,必须提供云厂商做不到、或者暂时做不好的独特价值。比如更强的跨云调度能力、更极致的故障切换能力,或者在跨模型调用中形成真正的数据飞轮和使用粘性。否则,它很容易被云厂商的功能所吸收,最后只剩下一层很薄的通道价值。

所以,至少在现阶段,Token 运营平台更像一个想象空间很大、但真正护城河还没有完全跑出来的赛道。它有机会成为入口,但也很容易停留在工具层;它有机会做成平台,但也可能最终只是云厂商功能的一部分。

这也是为什么,从投资角度看,Token 运营平台更适合被当作一种 " 期权型机会 " 来观察,而不是轻易当作已经被验证的核心基础设施。

这场变化为什么仍然值得重视?

如果只把 Token 工厂和 Token 运营看成两个新概念,意义并不大。真正值得重视的是,它们反映出 AI 产业正在发生三个深层变化。

第一,从 " 卖资源 " 走向 " 卖结果 "。过去卖的是算力本身,未来卖的是模型输出能力。这意味着产业竞争的核心,从资源占有,转向效率和交付能力。

第二,从 " 大厂全包 " 走向 " 专业分工 "。模型厂商不可能永远把所有事情都自己做完。当产业成熟,专业化分工一定会出现。有人专注模型,有人专注 Token 生产,有人专注 Token 分发,这反而会提高整个产业的效率。

第三,从 " 概念驱动 " 走向 " 商业闭环驱动 "。前几年,很多 AI 故事讲的是想象空间。但真正决定企业价值的,最终还是能不能形成可持续收入、可复制模式和可验证利润。

从这个意义上说,Token 工厂和 Token 运营不是概念的延伸,而是商业化更进一步的体现。只是,站在投资视角看,还需要多补一句:新分工不等于新护城河,商业模式升级也不自动等于资本回报升级。

哪些方向更值得跟踪?

如果保留一点投资研究视角,那么这个赛道值得看的,不只是 " 谁先提概念 ",而是谁更接近真实落地。

一类是绑定头部客户的 Token 工厂。这类公司如果已经和互联网大厂、模型厂商形成稳定合作,那么它们的业务确定性会更强。但真正更值得重视的,往往不是服务于最强自研模型体系的 " 补充性外采 ",而是那些深度绑定了非自研模型、或者在长期合作中已经嵌入客户核心流程的玩家。

一类是有垂直场景闭环的公司。比如在 AI Coding、企业服务、智能营销等领域,本身就有应用入口和客户基础的企业。如果它们把场景与推理服务结合起来,往往更容易形成持续的 Token 消耗和商业闭环。

还有一类是专注推理优化的技术型公司。这类公司不一定最显眼,但如果能在特定芯片、特定模型、特定场景上把效率做到极致,未来可能拥有很强的议价能力。当然,这里同样要警惕:技术优势如果不能持续演进,就可能很快被开源生态追平。

最后,是具备平台属性的 Token 运营商。它们的关键看点,不是接入多少模型,而是能不能形成统一入口、稳定服务和智能调度能力。更重要的是,它们必须证明自己提供的是云厂商之外的增量价值,而不是一个迟早会被整合掉的中间层。

最后,越是新赛道,越要看清它真正的门槛。

Token 工厂和 Token 运营的确代表了一种值得重视的新趋势,但这并不意味着这条路会一帆风顺。

最先摆在眼前的,还是算力本身的约束。AI 推理服务说到底,仍然建立在高端芯片、稳定集群和持续供给之上。如果核心算力资源持续紧张,或者供应链再度收紧,那么很多看上去很美的扩张计划,最后都可能慢下来。

与此同时,这个行业未来也很难避免价格竞争。模型越来越多,服务越来越丰富,价格下行几乎是技术产业成熟过程中的常见现象。一旦价格不断下探,企业比拼的就不再是谁讲得更动听,而是谁能把成本控制得更低、把效率做得更高。

还有一个不能忽视的变量,是技术进步本身。今天一些公司看起来领先,往往是因为它们在推理优化、模型部署和调度方面走在前面。但 AI 行业变化太快,很多领先优势都可能在开源工具和通用框架快速演进后被缩短。所以,今天的壁垒,更像是阶段性的领先,而不是一劳永逸的护城河。

比这些更需要小心的,是概念先行。每当一个新赛道受到关注,市场上总会出现一些 " 听起来很像、实际上还差得很远 " 的公司。做算力,不一定就能做好 Token 工厂;能聚合接口,也不等于就能成为真正的 Token 运营平台。这中间隔着的,不只是技术,更是客户、交付、调度、稳定性和长期运营能力。

如果再往投资层面多看一眼,还要补上两个经常被忽略的问题:一个是资本回报。Token 工厂看上去毛利率不低,但它本质上仍然是重资产、强投入的生意。高毛利并不必然等于高回报,真正需要看的,是长期 ROIC、自由现金流,以及高折旧能否被持续增长覆盖。另一个是定价权。如果上游模型厂商越来越强势,下游客户又越来越会压价,那么夹在中间的 Token 工厂未必能长期吃到最厚的一层利润。

所以,对这个新赛道最好的理解方式,不是急着判断谁会成为明星,而是先分清:哪些公司是真正在做能力建设,哪些公司只是借概念讲故事。因为真正能穿越周期的,从来不是最早喊口号的人,而是最早把能力做扎实的人。

而对投资者来说,也许还要再记住一句更冷静的话:在这场 " 卖 Token" 的热潮里,最终赚得最稳的,未必是 Token 工厂本身,也可能依然是那些卖 HBM、光模块和关键基础设施的 " 铲子商 "

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 张博 英伟达 gpu 浮出水面
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论