全天候科技 21小时前
Token狂欢退潮后的企业现实:预算管控成新常态,但AI列车未减速
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

企业 AI 消费的 " 无限畅饮 " 时代正在收尾,但账单管控并不等于踩刹车。

今年上半年,"Token 最大化 "(Tokenmaxxing)成为企业 AI 圈的流行词。Meta、Salesforce 等公司主动鼓励员工尽可能多地消耗 AI Token 以提升生产力。Meta 内部甚至出现了一个名为 " 克劳德经济学 "(Claudeconomics)的排行榜,追踪公司前 250 名重度用户。数据显示,Meta 员工在 30 天内消耗了超过60 万亿个 Token,单个最高消耗用户约达2800 亿个 Token。员工们为了竞逐 "Token 传奇 "" 缓存巫师 " 等称号,让 AI 代理花数小时做无意义的研究来 " 烧 Token"。

随后,Uber 因在四个月内烧光 Claude Code 和 Codex 全年预算登上头条,随即对员工实施每月1500 美元的使用上限,超出部分需逐案审批。

这些事件引发广泛关注。但 SemiAnalysis 团队在 Databricks AI 峰会上进行实地调研,并通过 Slack、电话与超过 50 家企业客户深度交流后,得出了与媒体叙事截然不同的结论。

该机构认为,媒体的报道严重夸大了问题的普遍性。Meta 和 Uber 的极端案例,根源是激励机制失当和内部管理松弛,而非企业 AI 投入整体失控。

头条故事被夸大,真实数据更温和

媒体报道可能夸大了企业 AI 预算危机。

关键数据支撑这一判断。SemiAnalysis 援引 Ramp 的消费数据显示,前 1% 的头部客户每位员工年均 AI 支出约9 万美元,前 10% 约为7300 美元,而 Ramp 客户的中位数仅为136 美元。Ramp 客户整体技术应用水平已远高于普通企业,但《财富》500 强媒体类客户的人均 AI 支出仍远低于100 美元

即便是 " 烧 Token 大户 "Meta,按标价计算每年每位员工花费接近5 万美元,据 SemiAnalysis 估算也仅占 Anthropic 客户收入的3% 至 5%

Anthropic 自身文档也印证了这一点:Claude Code 开发者月均支出仅150 至 250 美元,仅10%的用户日均花费超过 30 美元。

SemiAnalysis 认为:" 媒体的夸大报道并不属实——企业仍在持续投入,新的需求场景和垂直领域带来的 Token 消耗,正推动着 AI 列车以迅猛的速度继续前行。"

这意味着企业 AI 采用仍处在不均匀扩散阶段。不是所有员工都在高频调用大模型。很多公司只是少数团队、少数岗位先跑起来。

预算管控成新常态,但标准五花八门

超过 50 家受访企业中,大多数已对 AI 使用设置硬性上限。但各公司的标准差异极大,并无行业共识。

低端案例:

美国排名前三的航空航天与国防制造商:每人每月250 美元上限,部分重度用户首月四天即耗尽额度

全球最大制药公司之一:每人每月500 美元,特殊情况可申请1000 美元

高端案例:

Workday、Stripe:员工月度预算约2000 美元

上市网络安全公司:初级员工每月800 美元,高级员工1600 至 4000 美元,数据科学家获最高额度

大型旅游科技公司(1500 名员工中 800 名工程师,年 AI 支出接近1000 万美元):默认每人每月200 美元,根据职位可增至数万美元

预算设定逻辑也各有不同。一家美国三大航空公司之一的做法最为特殊:Token 分配直接与具体项目及预期营收挂钩。例如,一个预期营收1000 万美元的项目,财务团队批准100 万美元总支出预算,团队再自行决定其中多少比例用于 Token —— AI 成本被纳入项目财务模型,而非单独的 IT 预算。

员工的 " 省 Token" 生存法则

预算压力倒逼出了一套实用的 Token 节约策略。

最典型的是 "Copilot 套利 ":微软 365 企业版订阅用户可免费无限使用标准 Copilot 聊天机器人,且该使用量不计入月度 AI 预算。一家大型荷兰消费品与健康科技公司明确表示,员工会先用 Copilot 草拟和整合创意,再调用 Claude 或 Codex 处理最终任务,以此节约计量 Token。

模型降级也是常见手段。那家全球旅游科技公司已将所有员工的 Claude 默认模型从Opus 切换为 Sonnet,Opus 仍可使用但需主动选择。那家航空航天与国防制造商则直接 " 关闭 " 了Opus 4.8 和快速模式

对此,SemiAnalysis 团队直接点评了管理层的逻辑:" 管理层认为给员工更大的 Token 预算会促使他们自动化那些根本不该自动化的任务,比如撰写邮件。我们认为这种反自动化观点过于天真。"

便宜 Token 需求仍在增长,TaaS/API 端点市场没有冷下来

预算管理不等于减少调用。企业更关心的是单位成本。

便宜 Token 的需求仍然强。前沿模型和开源模型的 Token-as-a-Service/API 端点市场都在增长。AWS Bedrock 被纳入测算后,SemiAnalysis 对 AWS 本季度整体增长率的估计高于市场预期。

TaaS 供应商也在扩张。Together、Fireworks、Baseten 等公司合计 ARR 已超过 40 亿美元。

这说明企业预算压力会改变采购结构。能用便宜模型解决的问题,就不会一直调用最贵模型。默认模型被降级,不代表 AI 使用减少,而是成本曲线被重新优化。

编码仍是最强需求,AI 列车没有因为预算上限而减速

编码场景仍是当前 AI 收入最大的驱动力,OpenAI 和 Anthropic 逾 70% 的 ARR 来自这一方向。Anthropic B2B 占比超 90%(OpenAI 约 60%),决定了其收入结构对企业端的依赖更深,也更稳定。

下一波增长被认为将来自网络安全和白领知识工作。随着 Cowork、CoPilot、Codex 及 Computer 类产品进一步渗透企业,编码市场拉动 AI 实验室 ARR 增长的路径,会在更广泛的场景中重演。

当前大多数财富 500 强企业的人均 AI 支出仍远低于 2000 美元 / 年,主要集中在工程和数据科学部门。这意味着 AI 在企业中的普及还处于早期阶段,增长空间并未消失,只是换了形态——从 " 随意烧钱 " 变成了 " 有预算地持续投入 "。

AI 真正的 ROI:效率提升,但产出预期也在同步上升

在受访企业中,AI 带来的效率提升案例真实存在,且效果显著。

亚马逊招聘部门:从初步筛选到团队安置的流程,过去需要6 至 9 个月,借助 AI 工具后缩短至3 至 4 个月

一家为 85% 的《财富》500 强提供数据分析服务的公司:过去需要一周完成的工作,现在只需几小时

但效率提升的另一面是:产出预期同步上升。一位法律数据与风险解决方案公司的员工坦言,原本一周的工作量被压缩到几小时," 但公司却因此期待她完成更多工作,结果她比之前更忙碌了。"

SemiAnalysis 指出,Uber、Meta 等公司的 Token 超支事件,根本原因是激励机制失当和监管松懈,而非缺乏高 ROI 的应用场景。亚马逊尽管大规模裁员,但因 AI 工具带来的效率提升,正在以更快速度招聘新员工——这是 AI 作为 " 人力杠杆 " 最清晰的注脚。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai uber 克劳德 经济学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论