雷锋网 03-25
RISC-V冲入服务器CPU核心赛场,玄铁C950定义高性能标杆
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者|包永刚

编辑|林觉民

七年前,RISC-V 能否进入高性能计算仍充满争议,今天这一问题正在被重新回答。

2026 年,达摩院在 2026 年玄铁生态大会发布新一代旗舰 CPU IP —— C950,再次突破 RISC-V 性能的天花板,在 SPECint2006 基准测试中突破 70 分,这款全球最强 RISC-V CPU,具备与 x86 和 Arm 在服务器 CPU 主赛场竞争的能力。

从 C930 跨过服务器 CPU 性能的门槛,到 C950 进入主流服务器 CPU 性能区间,RISC-V 不仅回应了曾经的质疑,也开始真正进入高性能 CPU 主赛场。

中国工程院院士倪光南在玄铁生态大会演讲中说:"RISC-V 诞生十五年来走出了一条令人惊叹的高速发展之路,正从‘备选’迅速地走向‘主流’。"

突破 RISC-V 的性能天花板只是起点,在补齐通用计算能力之后,RISC-V 试图以可定制化能力迎接 AI Agent 的时代机遇,在标准化计算之外打开增量空间。

达摩院的新品恰逢其时,玄铁 C950 的处理器首次原生支持 Qwen3-235B-A22B 与 DeepSeek V3-671B 这样的千亿参数大模型。

" 想要把 IP 变成落地的产品,最重要的是生态的繁荣。"达摩院首席科学家孟建熠强调生态的重要性,也试着回答 RISC-V 相比 Arm 的优势到底在哪的灵魂拷问。

答案的核心并不复杂,想要在存量市场做替代,就需要更高的性价比,想要抓住增量市场,就要充分发挥 RISC-V 可定制化的优势,满足包括 AI Agent 在内应用的需求。

这意味着当性能上限被抬高之后,RISC-V 的核心问题转变为:如何让生态飞轮转起来?

首次原生支持千亿参数模型,RISC-V 冲入高性能 CPU 主赛场

RISC-V 突破性能天花板的进程,并非一条上升的直线。

从 2019 年推出 SPECint2006 7 分 /GHz 的玄铁 C910,到 2025 年推出能够对标 Arm N2 的 SPECint2006 15 分 /GH 的玄铁 C930,间隔了 6 年时间。

" 我们推出玄铁 C910 就是要把 RISC-V 往高性能的方向牵引,那时候我们就想做服务器,可是非常艰难,因为 RISC-V 没有高端软件生态。" 孟建熠说," 我们不得不花几年先把端侧的软件生态做起来。"

RISC-V 在端侧的软件生态逐步完善之后,玄铁团就带着 RISC-V 冲向了服务器 CPU 这个金字塔尖的市场。并且,从玄铁 C930 跨过服务器 CPU 门槛,到玄铁 C950 的性能进入主流服务器市场,仅间隔了一年时间。

" 从立项到具备商业化能力,我们花了两年时间打磨玄铁 C950。对我们来说这是一个不小的挑战。" 孟建熠感触很深," 要推出有竞争力的高性能 RISC-V IP,性能、功耗、面积的优化本身就是挑战,玄铁的研发团队花了很大的精力,同时为了满足服务器对高稳定性和高可靠性的要求,在 RISC-V 还没有可靠性标准时,我们面临着更大挑战。"

克服重重困难之后,从玄铁 C910 到玄铁 C950,玄铁完成了 RISC-V 在高性能市场从验证可能性到进入主赛场的跨越,也树立了高性能的标杆。

玄铁 C950 采用 8 指令译码、16 级流水线、超 1000 条指令乱序窗口,在 5nm 制程下的单核性能超过 22/GHz,最高主频达 3.2GHz,在 SPECint2006 基准测试中总分突破 70 分。这意味着,在传统由 x86 和 Arm 主导的高性能 CPU 市场中(如英特尔至强 6、AMD Zen5、Arm NeoverseV2),RISC-V 首次拥有了可以正面对标的产品。

经过软硬件协同优化,在 MySQL、Redis、Nginx 等服务器经典工作负载下,玄铁 C950 各性能指标跻身行业第一梯队,发挥 RISC-V 的定制化优势,软硬件协同优化后,云存储、云网络性能更能提升 30% 以上。

从基准测试到真实负载表现,RISC-V 高性能处理器在达摩院玄铁的持续投入下,终于坐上了高性能 CPU 的主桌,也撞上个人 AI 和物理 AI 的时代机遇。

在 AI 训练主导的时代,CPU 的价值被 GPU 弱化。但如今进入 AI Agent 时代,GPU 之王英伟达 GTC 2026 推出为 AI 优化的 CPU,宣告了 CPU 不再是 GPU 配角,而是 AI Agent 时代重新定义的核心组件。

在 Agent 负载中,CPU 不仅承担调度角色,还需要处理通用计算与加速计算的融合,这对架构提出了新的要求,这正是 C950 设计的核心方向。

凭借 AI 原生的 Vector 加速引擎和 Matrix 加速引擎,玄铁 C950 的单核 FP4 算力突破 8TFLOP,加上配置 4096-bit 超大位宽 Tensor Cache,通用高性能算力与 AI 算力融合,强力提升矩阵算力兑付率,在业界首次基于 RISC-V 顺利运行 Qwen3-235B-A22B 与 DeepSeek V3-671B 大模型,首 Token 延迟分别为 3.4s 和 1.7s,输出速度分别为 34 Tokens/s 和 18 Tokens/s。

在 RISC-V 架构上首次原生支持千亿参数模型,拥有不影响使用体验的性能,这一结果最重要的意义不在于性能本身,而在于 RISC-V 开始具备承载主流大模型推理负载的能力边界。

"玄铁 C950 支持千亿参数大模型,对于需要本地低成本部署的场景和可以而言是一种选择,合作伙伴进一步优化之后可以达到更高性能。" 孟建熠指出。

除了推出面向 AI Agent 的 RISC-V 性能标杆玄铁 C950,达摩院在玄铁生态大会上还推出了高能效 CPU IP 玄铁 C925,单核性能超过 12/GHz,能效比大幅提升,面积大幅减少。

去年发布的玄铁 C930 的性能在过去一年也被进一步优化,从发布时的单核性能超过 15/GHz 提升到 17/GHz,C925、C925、C950 分别代表极致性能、全面均衡与超高能效,是玄铁面向服务器及 AI 市场的三张牌。

孟建熠向雷峰网透露,服务器高性能系列的 CPU 计划按照每两年一代的节奏更新。

如果再加上玄铁已经发布的 C 系列、E 系列、R 系,达摩院已经拥有覆盖从嵌入式到 MCU、从端侧到云端,3 个系列 15 款 CPU IP,是为数不多拥有完整 RISC-V 全家桶 IP 的公司,2026 玄铁生态大会上近 50 个应用也展示着玄铁产品的丰富程度。

要将完整的 CPU IP 产品组合转化为最终落地的产品和商业上的成功,生态成为关键。

RISC-V 生态飞轮转起来的硬实力和软动力

"生态建设有两个关键,第一个是有足够好的产品能让客户使用,第二就是做好基础软件生态,给最终应用有创新的基础。" 孟建熠认为," 要让 RISC-V 的生态飞轮飞起来,需要有足够多有竞争力的通用 RISC-V 芯片,至少得有上百颗这样的芯片,RISC-V 的飞轮才能飞起来。"

一旦有竞争力的芯片、基础软件生态、应用形成一个正向循环的飞轮,RISC-V 的生态就会像滚雪球一样加速繁荣,达摩院已经运行起了这样硬实力 + 软动力的循环。

2019 年推出玄铁 C910 后,玄铁团队花了大量的精力和资源去做各种操作系统的适配,包括 Android、openKylin、openEuler、OpenAnolis 等超过十个操作系统和 6500+ 中间件,为 C910 支撑 RISC-V 笔记本电脑的稳定运行,以及让欧洲云服务商 Scaleway 对外提供云实力提供了保障。

这一阶段的核心意义在于,让 RISC-V 从能运行走向可使用,为后续高性能计算打下基础,玄铁 C920 也是关键一环。

玄铁的一个合作伙伴基于玄铁 C920 推出了 64 核的服务器,使用这一服务器,某巨头公司在向 RISC-V 移植软件的过程中,发现运行大型软件性能还是不够,于是推着玄铁团队再次突破 RISC-V 的性能瓶颈,C930 和 C950 为 RISC-V 高性能而生。

有了更高性能的 RISC-V 硬件之后,高性能通用软件拥有了运行的载体。达摩院与中国科学院软件研究所等联合发起如意社区,共同优化 AI 和高性能通用计算软件栈。

但要完善 RISC-V 高性能计算的生态,互联网巨头必不可少。就像 AWS 推动了 Arm 在服务器市场生态的成熟,历史经验表明,云厂商的采用往往是架构进入主流市场的关键拐点。

" 头部公司使用 RISC-V 架构,一方面有很好的引领作用,另一方面他们构建的软件生态能力也很强,会对我们的生态发展有贡献。" 孟建熠透露,玄铁 C950 在设计时就充分了解了阿里云以及国内其它云厂商的需求。

孟建熠预期,RISC-V CPU 在高性能市场想要成功,会比 Arm 稍微快一点,但也需要近十年时间。

在 2026 年玄铁生态大会上,清微智能、全志科技、瑞芯微、北京智芯微、宏思电子、南芯科技、物奇微、特普斯微等行业领军企业展示了 RISC-V 在 AI 眼镜、电力工控、Wi-Fi 网络、电源管理、数据安全、物联网、服务器等领域的应用案例,获颁 2026 年度 " 玄铁优选芯片 "。

达摩院牵头的无剑联盟也打造了在海尔家电体系落地的商业范式。

无剑联盟能够吸引家电领域的巨头的关键在于,海尔在研发智能家电时有定制芯片方面的需求,海尔原来计划自己研发,后来发现依托 RISC-V 生态,就能获得满足需求的定制芯片。

今年无剑联盟还迎来了国芯科技、Canonical、千问、天翼云、SGS 等新成员。

达摩院正在让有竞争力的芯片、通用计算软件生态、应用的飞轮旋转起来,但要形成一个技术和商业的闭环,需要回答一个灵魂拷问。

RISC-V 比 Arm 有何优势?

" 我每天可能要被问十几遍,RISC-V 到底比 Arm 好在哪?"孟建熠坦言," 通用的计算需求,RISC-V 并不一定优于 Arm,但在需要深度软硬协同优化的场景中,RISC-V 的可扩展性可以体现结构性优势。"

玄铁的有两个思路,第一个是通过技术创新进入原来没进入的市场,另一个就是通过应用牵引,给用户提供差异化的能力。这两个路径能实现的前提,是先做好基础软件和生态,让更多用户和潜在客户对 RISC-V 有信心,才会涌现出扩展和定制化需求和客户。

" 以前我们在基础软件的思路里打转,如今已经转到了下游应用。"孟建熠分享," 只有了解下游应用的需求,才有机会做出满足下游有竞争力的产品,RISC-V 标准和产品的演进也才能跟上应用的变化。"

从补齐基础能力转向面向应用优化,RISC-V 开始进入价值兑现阶段。

孟建熠深刻的意识到,RISC-V 仅仅是性能比 Arm 好也很难打动客户,只有让用户感受到技术创新带来的价值,解决客户的问题客户才会买单。

达摩院玄铁推出了 Flex 可扩展平台,这一平台包括处理器建模、开发环境和软件工具链等,支持全套软硬件框架进行自定义改动,客户可以打造最符合垂直场景需求的创新 CPU。

与客户的合作验证显示,用 Flex 改动的 CPU 相较通用玄铁 CPU 可实现最高 10 倍加速,大幅提升应用表现。

" 对于许多客户而言,想要从头开始做 RVV1.0 的产品有难度,但是如果在 RVV1.0 的基础上进行扩展,他们有很强的能力,因为可以结合自己应用的需求和 Know-How 充分发挥 RISC-V 的定制化需求。" 孟建熠指出。

玄铁的目标是,主流赛道里的头部公司都能采用 RISC-V 的产品,目前已经有许多 AI 创新类和 AI Infra 公司采用玄铁的产品。

孟建熠说,"我们会建设一个与 Arm 不一样的生态,首先我们扎根在本地,能提供更好的本地化服务;其次 RISC-V 更开放,允许修改代码,也推出 Flex 平台更好支持定制化;当然我们有大量的合作,包含大量软件的合作伙伴,大家一起实现 RISC-V 在高性能市场的商业闭环。"

从 C910 到 C950,阿里已经在这个领域投入了 8 年,RISC-V 也已经成为 "15 岁的少年 ",达摩院玄铁完成的并不仅是性能提升,而是将 RISC-V 带入了一个新的阶段——开始具备参与主流算力竞争的能力。

在高性能 CPU 这条长期赛道上,RISC-V 仍在早期,但随着性能上限被不断抬高,一个新的问题正在浮现:未来的高性能计算体系,是否会围绕可扩展架构重新定义。

玄铁,正在给出这个问题的答案。

更多 RISC-V 的深度交流欢迎添加作者微信 BENSONEIT。雷峰网

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

risc-v ai 中国工程院 院士
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论