又一大厂入局超节点！百度公布AI芯片路线图后续将推千卡、4000卡超节点

《科创板日报》11 月 13 日讯（记者黄心怡）在今日举行的百度世界大会上，百度发布了新一代昆仑芯 M100 和 M300。

同步发布的天池 256 超节点与天池 512 超节点将于明年正式上市，单个天池 512 超节点就能完成万亿参数模型训练。未来五年昆仑芯都将按年推出新产品，百度智能云还将陆续推出相应的千卡、4000 卡超节点。

此外，百度还发布了文心大模型 5.0、实时互动型数字人、通用智能体 GenFlow 3.0 版本等。在 AI 硬件方面，小度 AI 眼镜 Pro、小度智能摄像机 C1200 三摄版和 C800 视频通话版、小度智能音箱 Fun 等一同亮相，将搭载多模态 AI 智能助手——超能小度。

魔形智能 CEO 徐凌杰告诉《科创板日报》记者，超节点俨然已经成为了未来数据中心大模型算力平台的标配和方向。但受限于可靠性和配套工具链，目前仍处在小范围试点阶段。

▍昆仑芯单一集群规模计划扩至百万卡级

这次大会上发布的新一代昆仑芯包括两款产品。其中，昆仑芯 M100 针对大规模推理场景优化设计，将于 2026 年上市；昆仑芯 M300 面向超大规模的多模态模型的训练和推理任务，预计 2027 年上市。

会上，百度智能云宣布将不断加大在超节点上的建设，正式发布基于昆仑芯的新一代超节点——天池 256 和天池 512。

相比上一代产品，天池 256 超节点最高支持 256 卡极速互联，卡间互联带宽提升 4 倍、整体性能提升 50%；天池 512 超节点最高支持 512 卡极速互联，单个超节点即可支撑万亿参数模型训练。两款产品将于明年正式上市。

根据芯片路线图，未来，百度智能云还将陆续推出相应的千卡、4000 卡超节点：预计在 2028 年百度天池千卡级超节点将上市，2029 年昆仑芯 N 系列将上市，2030 年百度百舸百万卡昆仑芯单集群将点亮。

昆仑芯和天池超节点路线图

目前，昆仑芯已累计完成数万卡部署。百度在今年已经点亮了昆仑芯三万卡集群，可同时支撑多个千亿参数大模型训练。未来，百度智能云将把昆仑芯单一集群的规模从三万卡进一步扩展至百万卡级别。

▍超节点成为 AI 基础设施建设新常态

除了百度外，阿里、华为、中兴通讯、中科曙光等都纷纷入局。

11 月 6 日，2025 世界互联网大会乌镇峰会期间，中科曙光正式发布全球首个单机柜级 640 卡超节点 scaleX640，采用超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等技术。

2025 年云栖大会现场，阿里云发布全新一代磐久 128 超节点 AI 服务器，由阿里云自主研发设计，可支持多种 AI 芯片，单柜支持 128 个 AI 计算芯片。

华为此前推出了 Atlas 900 A3 SuperPoD（CoudMatrix 384 超节点），已累计部署 300+ 套，服务 20+ 客户。后续将推出更强的超节点 Atlas 950 SuperPoD，支持 8192 张昇腾卡，算力达 8 EFLOPS FP8 / 16 EFLOPS FP4，全光互联带宽 16.3PB/s，预计于 2026 年四季度上市。

此外，华为还规划后续推出超节点产品 Atlas 960 SuperPoD ，预计将支持 15488 张昇腾卡，算力达 30 EFLOPS FP8 / 60 EFLOPS FP4，计划 2027 年四季度上市。

而上海仪电联合曦智科技、壁仞科技、中兴通讯发布了国内首个光互连光交换 GPU 超节点——光跃 LightSphere X。该超节点基于曦智科技全球首创的分布式光交换技术，采用硅光技术的光互连光交换芯片和壁仞科技自主原创架构的大算力通用 GPU 液冷模组与全新载板互连，并搭载中兴通讯高性能 AI 国产服务器及仪电智算云平台软件。

对于互联网厂商自研超节点，有芯片业内人士对《科创板日报》表示，这正如 OpenAI 在采购英伟达芯片的同时，也要自研算力芯片。对于互联网厂商而言，自研芯片和超节点能够实现自主可控，从芯片到芯片间的通信协议都实现自研，可以避免 " 卡脖子 "，但在实际应用中，不一定算力中心全部采用自研芯片。

▍超节点仍处在小范围试点阶段

魔形智能 CEO 徐凌杰告诉《科创板日报》记者，从去年英伟达发布 NVL72 超节点，到今年各家厂商陆续发布超节点产品，超节点俨然已经成为了未来数据中心大模型算力平台的标配和方向。超高算力密度的超节点通过把更多的芯片在系统中高速互连，理论上能够显著提升大模型运行的效率，大幅降低总体拥有成本（TCO）, 但受限于可靠性和配套工具链，目前仍处在小范围试点阶段。

根据此前媒体报道，目前英伟达 NVL72 尚未完成大规模训练任务，因其软件尚待成熟且可靠性挑战仍在攻关中。徐凌杰表示，除了性能之外，能把系统的稳定性和可靠性做好成为了检验超节点是否能够大规模商业化落地的试金石。

" 现今主流在用的 AI 芯片，功耗往往不超过 700 瓦，面向未来的应用场景，单颗 AI 芯片的功耗会超过 1000 瓦，通过芯粒（Chiplet）方式多颗封装之后可以高达 2000 瓦以上，这就对供电、散热等配套设备提出了更高的要求。我国的芯片在国产制程上暂时落后于世界最先进水平，但在系统层面做高密度集成大有可为，通过打造一个强大且团结的供应链产业链，能够带动从 AI 芯片、CPU、互联芯片，到高端 PCB、液冷系统、供电系统和互联介质等多个关键领域，有利于打造一个万亿级别的智算市场。" 徐凌杰称。

此外，对于推理业务，超节点异构化的趋势也非常明显。徐凌杰介绍，英伟达在 Rubin 系列中就用两款不同芯片来分别处理 prefill（预填充）和 decode（解码）任务。未来的超节点在 token 成本上要有商业竞争力，对于芯片公司来说，可能不是一款芯片打天下。至少需要 2-3 款芯片在系统里发挥不同作用，这对规模不大的芯片公司来说是一个不小的成本和研发压力。

宙世代

一起剪

相关标签