Token狂欢退潮后的企业现实：预算管控成新常态，但AI列车未减速

企业 AI 消费的 " 无限畅饮 " 时代正在收尾，但账单管控并不等于踩刹车。

今年上半年，"Token 最大化 "（Tokenmaxxing）成为企业 AI 圈的流行词。Meta、Salesforce 等公司主动鼓励员工尽可能多地消耗 AI Token 以提升生产力。Meta 内部甚至出现了一个名为 " 克劳德经济学 "（Claudeconomics）的排行榜，追踪公司前 250 名重度用户。数据显示，Meta 员工在 30 天内消耗了超过60 万亿个 Token，单个最高消耗用户约达2800 亿个 Token。员工们为了竞逐 "Token 传奇 "" 缓存巫师 " 等称号，让 AI 代理花数小时做无意义的研究来 " 烧 Token"。

随后，Uber 因在四个月内烧光 Claude Code 和 Codex 全年预算登上头条，随即对员工实施每月1500 美元的使用上限，超出部分需逐案审批。

这些事件引发广泛关注。但 SemiAnalysis 团队在 Databricks AI 峰会上进行实地调研，并通过 Slack、电话与超过 50 家企业客户深度交流后，得出了与媒体叙事截然不同的结论。

该机构认为，媒体的报道严重夸大了问题的普遍性。Meta 和 Uber 的极端案例，根源是激励机制失当和内部管理松弛，而非企业 AI 投入整体失控。

头条故事被夸大，真实数据更温和

媒体报道可能夸大了企业 AI 预算危机。

关键数据支撑这一判断。SemiAnalysis 援引 Ramp 的消费数据显示，前 1% 的头部客户每位员工年均 AI 支出约9 万美元，前 10% 约为7300 美元，而 Ramp 客户的中位数仅为136 美元。Ramp 客户整体技术应用水平已远高于普通企业，但《财富》500 强媒体类客户的人均 AI 支出仍远低于100 美元。

即便是 " 烧 Token 大户 "Meta，按标价计算每年每位员工花费接近5 万美元，据 SemiAnalysis 估算也仅占 Anthropic 客户收入的3% 至 5%。

Anthropic 自身文档也印证了这一点：Claude Code 开发者月均支出仅150 至 250 美元，仅10%的用户日均花费超过 30 美元。

SemiAnalysis 认为：" 媒体的夸大报道并不属实——企业仍在持续投入，新的需求场景和垂直领域带来的 Token 消耗，正推动着 AI 列车以迅猛的速度继续前行。"

这意味着企业 AI 采用仍处在不均匀扩散阶段。不是所有员工都在高频调用大模型。很多公司只是少数团队、少数岗位先跑起来。

预算管控成新常态，但标准五花八门

超过 50 家受访企业中，大多数已对 AI 使用设置硬性上限。但各公司的标准差异极大，并无行业共识。

低端案例：

美国排名前三的航空航天与国防制造商：每人每月250 美元上限，部分重度用户首月四天即耗尽额度

全球最大制药公司之一：每人每月500 美元，特殊情况可申请1000 美元

高端案例：

Workday、Stripe：员工月度预算约2000 美元

上市网络安全公司：初级员工每月800 美元，高级员工1600 至 4000 美元，数据科学家获最高额度

大型旅游科技公司（1500 名员工中 800 名工程师，年 AI 支出接近1000 万美元）：默认每人每月200 美元，根据职位可增至数万美元

预算设定逻辑也各有不同。一家美国三大航空公司之一的做法最为特殊：Token 分配直接与具体项目及预期营收挂钩。例如，一个预期营收1000 万美元的项目，财务团队批准100 万美元总支出预算，团队再自行决定其中多少比例用于 Token —— AI 成本被纳入项目财务模型，而非单独的 IT 预算。

员工的 " 省 Token" 生存法则

预算压力倒逼出了一套实用的 Token 节约策略。

最典型的是 "Copilot 套利 "：微软 365 企业版订阅用户可免费无限使用标准 Copilot 聊天机器人，且该使用量不计入月度 AI 预算。一家大型荷兰消费品与健康科技公司明确表示，员工会先用 Copilot 草拟和整合创意，再调用 Claude 或 Codex 处理最终任务，以此节约计量 Token。

模型降级也是常见手段。那家全球旅游科技公司已将所有员工的 Claude 默认模型从Opus 切换为 Sonnet，Opus 仍可使用但需主动选择。那家航空航天与国防制造商则直接 " 关闭 " 了Opus 4.8 和快速模式。

对此，SemiAnalysis 团队直接点评了管理层的逻辑：" 管理层认为给员工更大的 Token 预算会促使他们自动化那些根本不该自动化的任务，比如撰写邮件。我们认为这种反自动化观点过于天真。"

便宜 Token 需求仍在增长，TaaS/API 端点市场没有冷下来

预算管理不等于减少调用。企业更关心的是单位成本。

便宜 Token 的需求仍然强。前沿模型和开源模型的 Token-as-a-Service/API 端点市场都在增长。AWS Bedrock 被纳入测算后，SemiAnalysis 对 AWS 本季度整体增长率的估计高于市场预期。

TaaS 供应商也在扩张。Together、Fireworks、Baseten 等公司合计 ARR 已超过 40 亿美元。

这说明企业预算压力会改变采购结构。能用便宜模型解决的问题，就不会一直调用最贵模型。默认模型被降级，不代表 AI 使用减少，而是成本曲线被重新优化。

编码仍是最强需求，AI 列车没有因为预算上限而减速

编码场景仍是当前 AI 收入最大的驱动力，OpenAI 和 Anthropic 逾 70% 的 ARR 来自这一方向。Anthropic B2B 占比超 90%（OpenAI 约 60%），决定了其收入结构对企业端的依赖更深，也更稳定。

下一波增长被认为将来自网络安全和白领知识工作。随着 Cowork、CoPilot、Codex 及 Computer 类产品进一步渗透企业，编码市场拉动 AI 实验室 ARR 增长的路径，会在更广泛的场景中重演。

当前大多数财富 500 强企业的人均 AI 支出仍远低于 2000 美元 / 年，主要集中在工程和数据科学部门。这意味着 AI 在企业中的普及还处于早期阶段，增长空间并未消失，只是换了形态——从 " 随意烧钱 " 变成了 " 有预算地持续投入 "。

AI 真正的 ROI：效率提升，但产出预期也在同步上升

在受访企业中，AI 带来的效率提升案例真实存在，且效果显著。

亚马逊招聘部门：从初步筛选到团队安置的流程，过去需要6 至 9 个月，借助 AI 工具后缩短至3 至 4 个月

一家为 85% 的《财富》500 强提供数据分析服务的公司：过去需要一周完成的工作，现在只需几小时

但效率提升的另一面是：产出预期同步上升。一位法律数据与风险解决方案公司的员工坦言，原本一周的工作量被压缩到几小时，" 但公司却因此期待她完成更多工作，结果她比之前更忙碌了。"

SemiAnalysis 指出，Uber、Meta 等公司的 Token 超支事件，根本原因是激励机制失当和监管松懈，而非缺乏高 ROI 的应用场景。亚马逊尽管大规模裁员，但因 AI 工具带来的效率提升，正在以更快速度招聘新员工——这是 AI 作为 " 人力杠杆 " 最清晰的注脚。

宙世代

一起剪

相关标签