"Token 每两周翻一倍 ",AI infra 正在被重写 "。
" 这种增长速度,在人类历史上都很少见。"
这是无问芯穹 CEO 夏立雪对当下 AI 行业最直观的感受。
" 养虾 " 成潮流后,AI 产业进入到一个更有意思的变化:需求侧反向重塑 AI 基础设施。
随之而来的是,Token 调用量暴涨、算力供需错配、系统架构承压,这些原本属于底层的问题,正成为行业发展的关键变量。
3 月 27 日,在 2026 中关村论坛年会—— AI 开源前沿论坛上,由月之暗面创始人杨植麟领衔主持,智谱华章 CEO 张鹏,无问芯穹联合创始人兼 CEO 夏立雪,小米 MiMo 大模型负责人罗福莉,香港大学助理教授 & 博士生导师、Nanobot 团队负责人黄超同台,围绕当下智能体浪潮、AI Infra 的演进方向等议题展开深度对话。
作为基础设施层的代表,夏立雪从 Token 供给与产业可持续发展的视角,分享了对这一轮 AI 变革的观察与思考。
Token 爆发:像极了 3G 时代的流量
在夏立雪看来,Token 不再只是一个计费单位,而正在成为类似 " 电力 "" 流量 " 的基础生产要素。
他将这一阶段类比为 3G 时代初期。当年移动互联网刚刚普及时,用户很快发现每月 100MB 流量远远不够用,需求迅速释放,最终催生出整个移动互联网生态。
" 现在 Token 的状态是一样的。" 他说," 我们甚至在开玩笑,未来手机可能会有两张卡,一张是流量卡,一张是 Token 卡。"
但与流量不同的是,Token 的增长背后,不只是 " 用得更多 ",而是使用方式发生了根本变化。
随着 Agent 的出现,AI 开始从 " 回答问题 " 走向 " 执行任务 "。一个复杂任务可能包含多轮推理、多次工具调用、多个子任务协同,这些都会显著提升 Token 消耗。
与此同时,并发能力也在发生变化:
" 一个 Agent 可以一秒钟起 1000 个任务,没有人类工程师能做到。"
围绕 Token ,新的产业分工也在逐渐清晰。夏立雪将 AI 产业的核心拆分为三个要素:模型的智能性、从资源到 Token 的转化效率、资源规模。
三者共同决定整个系统的产出能力。
" 模型厂商解决的是智能性的问题,而我们更关注的是生产效率——怎么把能源、算力转化为更多、更高质量的 Token 。"
在这个框架下,无问芯穹将自身定位为 " Token 工厂 ":通过软硬件协同、资源整合与调度优化,把分散的算力资源转化为可用的 Token 供给,并尽可能提升单位资源的产出效率。
基础设施重构:从 " 服务人类工程师 " 到 " 服务 AI"
如果说 Token 的爆发是表象,那么更深层的变化在于:现有基础设施的设计前提,正在被打破。
" 过去我们服务的是 CTO,是开发者,但未来的客户,其实是 AI,是 Agent。" 夏立雪说道。
人类工程师的工作节奏是串行的,而 Agent 具备高度并发能力;人类的响应速度是分钟级,而 AI 的反馈是秒级甚至毫秒级。这意味着,原本围绕 " 人 " 的行为模式构建的系统,在面对 AI 时会迅速成为瓶颈。
夏立雪对雷峰网表示,基础设施要适应 AI 超出人类的能力。
比如 Agent 可以瞬间发起上千个并发任务,这种规模和响应速度,是人类工程师不具备的。所以底层系统必须支持更高并发、更快调度,比如毫秒级弹性、分布式任务协同。
如果基础设施还是按照 " 人 " 的节奏设计,就会成为瓶颈。
其次,基础设施本身必须具备自我进化能力。
夏立雪提到, AI 的需求变化非常快,今天和明天可能完全不一样。所以 Infra 不能是静态系统,而是要能够持续迭代。我们现在也在基础设施里引入 AI 能力,让 AI 参与运维、调度、优化,甚至像一个 "CEO" 一样去协调多个 Agent 之间的协作。
从这个角度看,未来的基础设施不是简单支撑 AI,而是和 AI 深度融合的—— " 你中有我,我中有你 "。
这一判断,也解释了无问芯穹当前的技术路径:通过打通不同芯片架构、整合分散算力资源,并在系统层引入 AI 能力,实现资源调度与系统优化的持续进化。
" 我们希望做到的是,把容器、调度这些能力做到毫秒级弹性,去适应 AI 的行为方式。" 夏立雪认为。
供需错配与 Token 经济学:一场尚未完成的体系构建
尽管需求在快速增长,但当前行业面临的依旧是供需之间的结构性错配。
一方面,高端算力资源供不应求;另一方面,大量 " 可用但未被充分利用 " 的资源处于闲置状态。
" 大家都在用最优质的资源,但其实有很多资源是可以被用起来的。"
在夏立雪看来,这种现象并不意外。任何新兴产业在早期,都会集中使用最优资源完成突破,但随着规模扩大,必然走向分层与分化。
" 一个成熟的产业,不可能只有最顶级的产品和最顶级的资源。"
这也意味着,低端算力、非主流芯片、延迟较高的集群,并非 " 无效供给 ",而是尚未被正确匹配的资源。
无问芯穹的一个重要方向,就是通过调度与系统优化,让这些资源找到适合的应用场景,比如离线任务、低实时性需求等,从而缓解整体供需压力。
与此同时, Token 价格的变化,也成为市场的重要信号。
面对各家云厂商的提价现象,夏立雪的判断是:" 提价本质上说明,这件事情在用户侧产生了价值。"
在他看来,当前行业的一个关键问题,并不是 " 有没有价值 ",而是 ROI 是否跑通。
一方面,AI 已经可以替代部分人类劳动,例如助理型工作;另一方面,这些能力往往依赖高成本模型与算力,使得投入与产出未完全匹配。
" 模型厂商解决的是这个岗位存不存在,而我们要解决的是,这件事情能不能以更高效率完成,让它的成本和价值匹配。"
从更长周期来看,他认为 Token 经济体系仍在形成之中。
与移动互联网时代不同,AI 的服务对象不仅是人,也包括 AI 本身,这意味着未来可能出现全新的价值交换方式。
夏立雪也表示,AI 行业的健康发展必须打通完整的经济链路:将中国的能源转化为算力,把算力转化为 Token,最终落地转化为 GDP。
通过软硬件生态的底层打通,我们要打造属于中国的特色 Token 经济学,这不仅是盘活国内算力,更是要复刻 "Made in China" 的奇迹,推进 "AI-Made in China" 。
当中国庞大的能源与成本优势,通过高效率的 Token 工厂转化为优质、稳定的服务并输出到全球时,中国也将成为新时代的 " 世界 Token 工厂 ",为 AI 时代的全球分工贡献不可替代的中国方案。


登录后才可以发布评论哦
打开小程序可以发布评论哦