天数智芯：推理业务收入同比增长238.2%，训推双赛道爆发增长

3 月 30 日，国内通用 GPU 龙头天数智芯交出了其登陆港股市场后的首份完整年度成绩单。

天数智芯率先实现了全栈自研技术与规模化商业落地，营收首次突破 10 亿元，经调整净亏损显著收窄，推理业务收入同比增长 238.2%......

这些数字本身足够亮眼。但更重要的是，它们所指向的同一件事，国内 GPU 商业化落地的进度可能超出了市场的预期。

一、营收盈利全面向好，推理业务收入同增238.2%

根据业绩报告，公司 2025 年全年实现营业收入 10.34 亿元，同比增长 91.6%。

如果我们深入收入结构，则能清晰看到其增长的动力所在。

2025 年，公司核心的通用 GPU 产品收入达到 9.23 亿元，暴增 149.6%，占总营收的比重高达 89.3%。这表明公司的增长动力已高度集中于最具技术壁垒和规模效应的核心主业，即通用 GPU 芯片及加速卡的销售之上。业务结构的主动聚焦与优化，使得增长的内生动力更为强劲，收入基础更为健康、优质。

具体到产品线，天数智芯遵循训练与推理双轮驱动的策略，在 2025 年迎来了双线爆发。其中，专注于 AI 模型训练的 " 天垓 " 系列产品收入 5.84 亿元，同比增长 116.7%；而专为云端及边缘推理应用而设计的 " 智铠 " 系列产品收入 3.39 亿元，同比激增 238.2%。

两者均实现三位数增长，而推理业务超出训练业务增速一倍，表现尤为亮眼，增长后劲更猛，意味着公司精准抓住了 AI 基础设施市场中训练与推理的双重确定性机遇，尤其是推理需求爆发的机遇。

在高速增长的同时，公司的盈利质量与运营效率也在同步改善。

2025 年，公司实现 5.58 亿元的毛利，同比增速高达 110.5%，超越了营收增速；整体毛利率从 2024 年的 49.1% 提升至 54.0%。这直观地反映了其产品技术附加值的提升与成本控制能力的增强，并说明着公司的增长并非依靠 " 以价换量 " 或牺牲利润换取市场，而是其技术价值在市场上获得了更高效的转化。

在营收与毛利高增的背景下，公司经调整净亏损为 4.38 亿元，同比收窄 32.1%。这一指标剔除了以股份为基础的付款等非现金项目的影响，更能反映主营业务的经营效率。

值得一提的是，在营收近乎翻倍的情况下，公司的研发开支维持缓和增长，使得研发费用占收入的比例显著下降近 50pct。在资本极度密集、通常以 " 烧钱换技术 " 著称的芯片行业，这一变化预示着公司投入产出效率的优化，是其 " 量产一代、设计一代、预研一代 " 研发策略走向成熟的标志。

收入大幅增长，叠加经营效率提升，共同推动公司内生造血能力实质性增强。截至 2025 年末，公司现金及现金等价物达到 15.04 亿元，较上年同期大幅增加，为后续的研发投入与市场拓展储备了充足弹药。

二、从全栈能力到生态布局，进一步夯实竞争壁垒

在 GPU 这样一个高度依赖平台能力的行业，决定公司长期价值上限的，往往不是单一芯片的峰值性能，而是其构建完整的全栈能力与生态版图布局。

根据天数智芯的技术与生态布局，其商业模式正从提供硬件芯片，向交付一整套算力体系演进，这为其增长的可持续性与可扩展性奠定了坚实基础。

首先，天数智芯使软件成为硬件价值的放大器与最后一公里。公司的新一代软件开发平台，通过原生兼容行业主流编程模型并进行深度优化，实现了代码迁移效率 80% 以上的提升，支持海量算子分钟级平滑迁移，极大降低了开发者的使用门槛。同时，其自研的集群管理与调度体系，实现跨节点通信效率 30% 的提升，为规模集群的稳定、高效运行提供了底层保障。这意味着，客户得到的不仅是一块算力强大的加速卡，而是一套能够确保算力在实际业务场景中高效、稳定释放的工程方案。

在此基础上，公司加强端侧布局，精准卡位了算力需求演进的下一站。

天数智芯在夯实云端训练与推理主战场的同时，推出了面向机器人与智能终端场景的端侧产品线—— " 彤央 " 系列产品。这并不仅仅是简单的产品线延伸，还标志着公司率先完成了 " 云（训练 / 推理）- 边（推理）- 端（智能计算）" 的全栈产品矩阵布局。通过将云端异构计算与高并发推理能力延伸至边缘与终端，公司提前布下了应对 AI 算力泛在化、场景碎片化趋势的关键棋子，为未来在机器人、具身智能、工业互联网等新兴赛道的增长打开了广阔空间。

此外，强大的生态适配能力则进一步提升了公司的核心竞争力。天数智芯 DeepSpark 开源社区已成功适配超过 610 个主流算法模型，并具备对新发布的大模型实现 "Day0" 原生支持的能力。这种深度的、前瞻性的生态适配工作，确保了其算力平台能够无缝对接 AI 技术的快速迭代，让客户无需担忧底层算力的兼容性问题，从而实现了从可用到好用的关键跨越。

得益于强大的全栈能力与生态布局，公司商业落地加速。截至 2025 年末，公司累计服务客户超过 340 家，产品及解决方案在互联网、AI 大模型、科研、金融、医疗、教育、交通等领域部署超过 1000 项。报告期内，公司于 AIGC 全场景下的智能应用也已实现商用部署。同时，公司正将业务触角拓展至智能驾驶等前沿赛道，显示出其技术平台的延展性与对未来应用的捕捉能力。

三、Token 工厂时代，以高质量算力定义AI基础设施

近期密集的行业动态指明，AI 的发展正迈入新的阶段。

继，现象级开源项目 OpenClaw 推动 AI 进入 Agent 时代，带来 token 消耗量的指数级增长。3 月中旬，英伟达在 GTC 2026 上提出 "Token 工厂 " 范式，阿里集团成立 ATH 事业群将 "Token" 写入战略核心。根据沙利文报告，仅 2025 年下半年，中国企业级大模型日均调用量就飙升至 37.0 万亿 tokens，较上半年增长 263%。行业共识正在迅速形成，AI 产业已从模型能力竞赛迈入 "Token 经济 " 驱动的新阶段。

在此背景下，未来 GPU 的竞争逻辑正在发生根本性变化。第一阶段是拼算力，集中要解决 GPU 能不能跑的问题，第二阶段是拼效率，解决跑得值不值 " 的问题，即要在真实业务流中具备持续、高效、低成本产出 Token 的能力。

由此，市场对 GPU 的评判标准也必然随之发生深刻迁移。过去评估一家 GPU 公司，市场习惯性关注其芯片的绝对性能指标（FP32/FP64 算力）、以及所能支持的最大训练集群规模。而现在，随着推理成为增长主引擎，更值得关注的指标逐渐转向生产效率，即推理服务的实际调用量、单卡或单集群的 Token 产出效率、以及单位算力投入所能产生的业务价值。

但这一转变本身并不容易。

与训练阶段一次性、集中式的算力消耗不同，推理请求是持续的、随机的，并且对延迟高度敏感。如果算力无法在真实请求中被高效调度与稳定释放，那么再高的峰值性能，也难以转化为实际商业价值。

为了解决行业痛点，天数智芯的技术投入围绕提升推理效率展开，并取得了代表性的进展。

首先是无损量化技术。针对当下最前沿的大模型推理场景，公司通过搭载无损量化等核心技术的加速工具包，能够在完全保障模型精度的前提下，可实现算力利用率提升 60% 以上、长文本处理效率提升 50% 以上。这些具体、可量化的工程性突破，直指客户在实际部署中面临的效率、成本与性能痛点，构成了其深层的、难以被简单复制的技术护城河。

其次，针对大模型推理中预填充（Prefill）和解码（Decode）阶段对算力资源需求不同的特性，天数智芯采用业界前沿的 PD 分离（Prefill/Decode 解耦）架构，提升整体吞吐能力与响应效率。

叠加通算并行等底层优化，这一系列技术能通过更精细的算力调度与管理，优化整体吞吐量与响应速度，提升资源利用率与保障业务 SLA（服务水平协议）。

结语

天数智芯所展现的，是一条从全栈自研的技术深度，到规模化商业落地的市场广度，再到定义未来效率标准的产业高度的进阶路径。

当 "Token 经济 " 成为核心叙事，GPU 公司的角色便从一次性的硬件供应商，演变为持续创造价值的 Token 生产基础设施。

从这个意义上看，天数智芯所选择的技术路径显示出了深刻的预见性，已不仅是产品层面的技术领先，更是一种面向未来算力形态的提前布局。

而这，或许正是这家公司在新一轮产业周期中最值得被重新评估的地方。

宙世代

一起剪

相关标签