导语:在大模型应用爆发式增长的当下,如何控制推理成本成为企业核心痛点
为期三天的 2026 MWC 上海今日落下帷幕。作为全球规模最大、最具影响力的 ICT 行业盛会之一,本届大会汇聚了全球百余个国家和地区的科技巨头与创新力量,共同探索智能未来的边界。
在大模型应用爆发式增长的当下,如何控制推理成本成为企业核心痛点。敏锐捕捉这一行业需求的艾瑞咨询,在大会期间正式推出了 "Token 成本精益管理服务 "。针对企业 AI 支出快速增长却难以量化管理的痛点,提供从消耗可视化到价值评估的全链路治理方案。该服务将 Token 成本治理方法论转化为可运行的管理机制,旨在帮助企业将 AI 支出从 " 说不清的成本 " 转变为 " 算得清、管得住、越投越值的战略投资 "。

图:Token 成本精益管理服务产品受到企业客户青睐
艾瑞咨询调研发现,从月耗百万 Token 的中型公司到年支出过亿的集团企业,几乎没有一家能在初次沟通时说清 AI 成本的全貌。Token 消耗以秒计增长,AI 治理却近乎缺位——这一矛盾正在加剧。
高盛研究(Goldman Sachs Research)在《AI Agents Forecast to Boost Tech Cash Flow as Usage Soars》中预测,受 AI 智能体驱动,2030 年全球 Token 消耗量将达到 2026 年的 24 倍。与此同时,Redress Compliance 数据显示 73% 的企业 AI 部署超预算,MIT 指出 95% 的 AI 项目未能证明 ROI,Cast AI 2026 年调研更揭示企业 GPU 平均利用率仅为 5%。AI 投入持续攀升,回报却模糊不清。
艾瑞咨询认为," 管 AI" 与 " 管云 " 存在四点根本性差异,即便已具备成熟 FinOps 能力的企业,在 AI 成本治理时仍会面临全新挑战:
1. 消耗单元不同。 云资源按实例、存储、流量计费,边界清晰;Token 消耗则因模型差异、提示词差异,可能相差数十倍乃至上百倍。
2. 用量弹性不同。 云资源通常按月采购,相对可预测;Token 消耗是实时的,一个失控的 Agent 几小时就能耗尽整月预算。
3. 价值归因困难。 云费用可对应到服务器、数据库等具体基础设施;Token 消耗如何折算成业务产出,目前尚无行业标准。
4. 账单天然碎片化。 企业云资源通常集中在少数云厂商;AI 调用却分散在云平台、第三方 API(OpenAI、DeepSeek 等)及自有算力等多处,没有一张表能看清全貌。
这意味着,企业不能简单照搬云成本管理的既有路径,而需要针对 Token 消耗的实时性、归因复杂性和账单碎片化等特征进行针对性改造。
基于 FinOps 云成本治理实践经验,以及对 Token 经济特性的系统研究,艾瑞咨询将 Token 管理方法论总结为 " 四阶段飞轮 ",形成持续运转的管理闭环:
阶段一 · 看清: 建立跨平台、跨部门的 Token 消耗统一视图,理清钱花在哪、谁在花、花多少。通过六维标签体系构建多维消费画像,这是治理的前提。
阶段二 · 优化: 基于用量数据识别低效调用,从 Prompt 设计、模型选型到工程层的分层缓存与智能路由,系统性降低单次任务的 Token 成本。
阶段三 · 管控: 在 API 调用实时链路上部署管控机制,设置预算阈值与自动熔断,将治理从 " 事后对账 " 前移至 " 事中拦截 ",实现分层、可调、有激励的预算与配额控制。
阶段四 · 价值: 持续追踪关键 AI 应用的成本变化与产出趋势,运用价值评估四维模型与七种量化算法,把 "AI 支出值不值 " 的讨论从凭经验判断转向有数据支撑的价值评估,推动 AI 支出从被动消耗的 " 成本项 " 走向可衡量、可优化的 " 价值项 "。
四个阶段循环往复,使 Token 管理形成自优化闭环——让企业的每一个 Token,都花得清楚、用得高效、管得有度、收到回报。

图:AI 价值管理飞轮的四阶段递进,形成自优化的管理闭环
不同企业的 AI 应用成熟度、痛点需求和预算存在显著差异。为此,艾瑞咨询将 Token 管理服务设计为三个层级:
轻量诊断 —— 适合初步使用 AI 的企业。2 至 4 周内完成 Token 消耗全景摸排,形成优先治理清单,以最低成本构建 " 看清 " 的基础能力。
标准治理 —— 适合已有一定 AI 使用规模、需要建立系统治理机制的企业,覆盖标签体系搭建、预算分配框架设计与场景化 ROI 核算模型输出。
深度定制 —— 适合 AI 支出量大、业务场景复杂的企业,提供与业务系统深度集成的实时管控方案,并支持持续运营托管。
艾瑞咨询建议多数企业从 " 轻量诊断 " 起步,先 " 看清 " 再 " 优化 ",避免等到 Token 成本大幅攀升后才仓促应对。
相较于市场上已有的 AI 成本管理方案,艾瑞咨询的 Token 成本精益管理服务实现了三点核心创新:
第一,交付 " 机制 ",而非 " 报告 "。 传统咨询以提供报告为终点,但 Token 消耗以秒计算,等月底对账可能为时已晚。艾瑞咨询将方法论落地为可运行的技术工具,将管控逻辑部署在 API 调用的实时链路上——即便咨询团队离场,系统仍可持续运转。
第二,工具背后有方法论。 很多企业已具备企业级 API Gateway 能力,却仍无法回答 " 标签体系如何设计、预算如何拆分、ROI 如何核算 "。艾瑞咨询每个技术模块背后,都有完整的 Token 成本管理方法体系与云成本治理经验支撑。
第三,能做成本效益对标。 艾瑞咨询持续追踪中国企业 AI 市场,结合前沿 AI 行业应用洞察,以最新落地场景引领企业未来 AI 发力方向,而非仅停留在 " 你应该怎么做 " 的建议层面。

图:艾瑞咨询与传统服务的本质区别
艾瑞咨询是国内深耕新经济洞察与产业数智化落地的专业咨询机构。依托二十余年产业研究与数字化咨询实践积累,艾瑞咨询已形成覆盖产业研判、战略规划、企业数智化转型全流程的服务体系,持续为各行各业提供可落地的研究方案与转型路径支撑。
基于长期一线项目沉淀,艾瑞咨询搭建起 " 行业洞察 + 数据底座 + 方法论体系 + 配套技术工具 + 长期运营托管 " 五位一体落地模式,依托对行业场景、模型调用逻辑与成本结构的深度理解,协助国内企业系统性理顺 AI 投入产出体系,高效应对 AI 规模化运营过程中的成本管控难题。
(本文为艾瑞网独家原创稿件 转载请注明出处)


登录后才可以发布评论哦
打开小程序可以发布评论哦