《科创板日报》3 月 11 日讯 今日,腾讯云智能体开发平台宣布,将对部分模型的计费策略进行优化调整。
根据公告,本次调整主要涉及两类变更,一类是公测模型结束免费,GLM 5、MiniMax 2.5、Kimi 2.5 模型将于 3 月 13 日结束免费公测,转为正式商用服务,根据模型调用按量计费。另一类变更为对混元系列模型 Tencent HY2.0 Instruct 与 Tencent HY2.0 Think 服务进行涨价,具体情况如下图所示:

图源:腾讯云
可以看到,不论是输入价格或输出价格,此次涨价幅度普遍在 4 倍以上。以 Tencent HY2.0 Instruct 输入价格为例,由原先的 0.0008 元 / 千 tokens 调整为 0.004505 元 / 千 tokens,涨幅高达 463.13%。
放眼全行业,多个大模型厂商已传出涨价信号。OpenAI 日前将 GPT-5.4 输入价格涨至 2.5 美元 / 百万 token,输出价格 15 美元 / 百万 token。智谱 AI 则将 GLM Coding Plan 订阅价格提高至多 60%,API 调用价格提升 67%-100%。
《科创板日报》2 月 15 日报道《AI 遇上最强春节档 Token 通胀已成必然?》时提到,Token 需求正在发生 " 通胀 "。根据国联民生证券,这种 " 通胀 " 并非单纯是指 Token 本身变贵,还是指单位时间内、单位用户的 Token 消耗结构性上升。
近日,开源 AI" 龙虾 "OpenClaw 一经推出便全球爆火,作为一款可在用户自有设备上运行的个人 AI Agent 助手,其一个月间 Token 消耗量便翻 4 倍以上。数据显示,中国整体日均 Token 消耗于 2025 年中突破 30 万亿,2026 年 2 月主流大模型合计日均 Token 消耗已到 180 万亿级别。
国盛证券指出,由于 Agent 天然多工具调用 + 长上下文 + 多流程工作的特性,AI Agent 的 Token 消耗量较大,随着智能体运行规模与任务复杂度的同步提升,活跃智能体的 Token 消耗进入高速增长期。根据 IDC 预测,中国活跃智能体数量将在 2031 年突破 3.5 亿,智能体 Token 消耗将迎来年均超 30 倍的指数级跃升。
上述机构进一步强调,在 Token 消耗量骤增的情况下,一众主流模型厂商纷纷出现算力缺口,算力需求进一步加大。OpenClaw 的爆发式渗透验证商业可行性,Agent 渗透率和复杂度提升驱动 Token 消耗激增,催生刚性算力需求。随着国内市场 Token 消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导。


登录后才可以发布评论哦
打开小程序可以发布评论哦