全球RISC-V CPU性能新纪录——玄铁C950，正式发布！

公众号记得加星标⭐️，第一时间看推送不会错过。

回望过去 15 年，RISC-V 的演进，像极了一场层层推进的 " 三部曲 "：第一个 5 年，它是象牙塔里的开源探索，是极客们的学术理想；第二个 5 年，国际标准确立，商用 IP 开始在物联网（IoT）领域萌芽；而刚刚过去的第三个 5 年，我们见证了规模化的爆发——基于 RISC-V 的芯片已经在 MCU、嵌入式、家电、存储、多媒体、汽车、通信、安全和各种终端设备中快速铺开，开始形成 " 星火燎原 " 之势。

从数量增长来看，RISC-V 已经不再是少数人的试验田。行业分析机构 SHD Group 预测，到 2031 年，RISC-V 设备数量将超过 360 亿，年复合增长率 31.7%；IP 销售额将超 19 亿美元，年复合增长率 39.7%。无论是英伟达、英飞凌，还是高通对 Ventana 的收购动作，都表明 RISC-V 早已不再只是技术圈内部的话题，而是进入了全球主流芯片产业链的战略视野。

但热闹背后，也始终有一个绕不开的现实：RISC-V 虽然已经 " 无处不在 "，却仍然没有真正进入 " 核心 "。在大多数人的认知里，它依然贴着 " 低端、嵌入式、家电控制 " 的标签，难以触碰高性能算力的深水区。在真正决定架构话语权的高性能服务器、通用计算平台、云端基础设施、AI 推理与未来的大模型系统节点中，RISC-V 长期缺乏足够说服行业的代表性产品。

然而，在 2026 年 3 月 24 日，以 " 开放 · 连接 " 为名的玄铁 RISC-V 生态大会，成为了 RISC-V 告别 " 青涩期 " 的成人礼。此次大会上，阿里达摩院正式发布了最新、也是最强的 RISC-V CPU IP ——玄铁 C950。

随着玄铁 C950 的重磅登场，RISC-V 终于要撕掉长期以来困扰的 " 低端、边缘、辅助 " 标签。RISC-V 不再甘于在 MCU 或家电芯片中偏安一隅，而是以硬核性能为刃，正式切入高性能计算与 AI 的腹地。那堵曾被认为不可逾越的 " 高性能红利墙 "，在 2026 年的这个春天，裂开了缝隙。

玄铁 C950，

RISC-V 首次真正触碰 " 主流 CPU 天花板 "

从参数上来看，C950 的工作主频可以达到 3.2GHz 以上，单核性能超过 22/GHz，总体 SPECint2006 得分突破 70，创下 RISC-V 的最高纪录，已经和 Intel Xeon6、Arm V2、AMD Zen5 等主流高端 CPU 处于同一梯队。

不仅是跑分，在 MySQL、Redis、Nginx、OpenSSL 等典型服务器工作负载下，C950 的表现都已经可以与这些行业最新的产品正面对比。对于一个新架构来说，这比基准测试更重要，因为跑分可以代表上限，但真实工作负载才代表产业可用性。

与此同时，C950 全面支持 RVA23.1 的标配与可选扩展，同时具备 COVE 等最新规范能力，意味着它不是一颗孤立的 " 秀肌肉产品 "，而是在有意识地为进入 Linux、Android、服务器、AI、汽车等更大平台环境做准备。

回看玄铁过去几代产品，它不是突然冲上高性能，而是在持续用一代一代产品去试探 RISC-V 的性能上限，并逐步把这个上限变成产业可接受、可使用、可部署的现实能力。

2019 年，阿里巴巴发布玄铁 C910。当时，这颗产品最重要的意义，并不只是它本身，而是它第一次让行业看到了一个此前很多人不太敢相信的事实：RISC-V 并不存在天然的性能天花板。在那个时间点上，很多人仍然怀疑 RISC-V 究竟能不能落地，甚至连其在高端 MCU 之外能不能继续向上走，都还缺乏信心。而 C910 首次将运行频率推到 2GHz 以上，并在 SPECint2006 测试中达到约 7/GHz，等于为整个行业打开了一扇门：原来 RISC-V 不只是能做小核，也有可能走向高性能。

此后，玄铁并没有简单沿着 " 继续堆高性能 " 的直线往前狂奔。达摩院首席科学家孟建熠也谈到，C910 之后，最痛苦的部分反而不是继续追分，而是高端软件生态几乎一片空白。操作系统要适配，工具链要补，基础软件要完善，服务器能力要预研，整个产业必须从 " 有核可用 " 走向 " 有生态可用 "。这也是为什么 2019 年之后，玄铁一边继续提升高性能能力，一边又补做了大量中端产品，完善了整个产品线：因为那个阶段，市场真正能接受的大多还是 C910 以下的产品，而一个新架构想往上走，必须先把下面的地基夯实。

2025 年，玄铁发布 C930，SPECint2006 达到 15/GHz，第一次真正跨入服务器门槛；而到了这次大会，玄铁进一步把 C930 升级至约 17/GHz。此次 C950 的发布可以说第一次为 RISC-V 建立起了一块真正意义上的高性能标杆样板，第一次以可授权、可交付、可落地的 IP 形态，告诉所有人：RISC-V 不仅能继续向上，而且已经可以进入主流高性能 CPU 的竞争坐标系。它不再只是一个方向上的希望，而是一块现实中的参照物。此后，所有想做高性能 RISC-V 的人，几乎都必须面对 C950 所划出的这条线。

某种意义上说，玄铁这些年的投入，早已不只是 " 做出一颗更快的核 " 这么简单。它实际上是在替整个 RISC-V 高性能生态先补课、先探路、先垫底。也正因为如此，这次 C950 的出现，才不是一次单纯的参数刷新，而更像是一轮长期积累后的阶段性兑现。从这个角度看，C950 的发布，已经不只是玄铁产品线的一次升级，而是 RISC-V 作为新架构第一次以较完整的姿态，触碰主流高性能计算腹地。

从一颗旗舰，到一套梯队

而达摩院所祭出的高端线可不只是 C950 一员大将，还包括由 C930 进一步升级能效而来的 C925，以及继续优化后的 C930。三者大致形成了 12/GHz、17/GHz 和 22/GHz 三个性能层级，基本保持了约 5 分左右的阶梯差，且都已经可以对外授权。这样一来，玄铁就不只是拿出一颗 " 最强样板 "，而是初步搭好了一个从高性能终端、边缘计算，到边缘服务器、通用服务器的完整产品矩阵。

C925 的价值，在于填补 10 到 12 分这一性能空白。因为如果产品线直接从 7 分、8 分跳到 15 分以上，中间会缺少一大段真正有市场空间、又更容易被客户接受的区间。对于很多端侧、边缘侧和更关注能效、面积、成本平衡的客户来说，C925 反而可能是更容易落地的一张牌。它的架构更新，且支持最新的 Vector、Matrix 等能力，也使其相较老一代传统架构核具备了更明显的差异化潜力。

C930 则更像是面向边缘服务器、DPU、网络、服务器周边基础设施的均衡型产品。它既保留了较强的通用能力，也更适合部署在性能和成本都要权衡的中间层节点。而 C950 则明显直指对延迟、吞吐、通用性要求更高的 AI Agent、存储、通用服务器等场景。

从这个角度看，C925、C930、C950 并不是三颗彼此分散的处理器核，而是一整套沿着 " 端—边缘—服务器 " 逐级推进的 RISC-V 进攻框架。

对芯片公司而言，这种梯队式布局的价值非常直接：一家真正做 SoC 和平台产品的公司，往往并不只需要一颗核，而是需要高中低搭配、端边云贯通的软件一致性和产品节奏。孟建熠也特别强调，玄铁目前是国内少数、甚至可以说唯一能够覆盖从高性能到 MCU 全系解决方案的 IP 供应方。这种 " 全系列 + 一致性 " 的能力，本身就是其商业竞争力的一部分。

对一个后来者架构而言，真正重要的从来不是 " 进入了多少边缘设备 "，而是它是否终于有能力走进那些决定产业话语权的核心算力节点。

为 AI Agent 打造的 " 新型 CPU"

如果说高性能是 RISC-V 进入主流战场的门票，那么 AI 才是决定这张门票有没有现实意义的时代背景。

但相比 "AI 需要算力 " 这个共识，更值得关注的，是另一个正在发生的结构性变化：在 AI Agent 时代，CPU 正在重新成为算力体系中的关键变量。

过去很长一段时间里，AI 的叙事几乎完全围绕 GPU 展开，CPU 被弱化为调度与辅助单元，仿佛只要把并行算力堆上去，问题就可以解决。但当 AI 从 " 单模型响应 " 走向 " 多智能体协同 "，计算问题的本质已经发生变化——系统不再只是执行矩阵乘法，而是在运行一个高度耦合的复杂系统。

在这个系统中，任务被拆解、调度、编排、分发，再通过网络与存储不断流转，涉及 I/O、通信、缓存一致性、多线程并发以及系统级资源管理等一整套问题。AI 系统的瓶颈，正在从 " 算得快不快 "，转向 " 系统协同效率高不高 "。

而这一切，恰恰是 CPU 的主场。

CPU 并不是重新变重要，而是从原来的系统底座，开始上升为 " 系统中枢 "。一旦 CPU 在调度、I/O 或单核性能上成为短板，GPU 的算力就会被系统效率拖住。正如黄仁勋所说："CPU 太慢，会让 GPU 在等待中被浪费掉。"

从产业路径上看，这一变化已经形成共识。无论是英伟达从 Grace 到 Vera，再到与 GPU 深度耦合的 Rubin 架构，还是 Arm 持续强化其在数据中心 CPU 的定位，本质上都在回应同一个问题：AI 系统正在从 "GPU 中心 " 走向 "CPU+GPU 协同中心 "。

在孟建熠看来，未来的大 CPU，必须不是传统意义上只做通用计算的 CPU，而是面向 AI Agent 系统属性去设计的 CPU。高单核能力、良好的 I/O 能力、安全性、系统协同能力，这些都不再只是附加项，而是 AI 时代 CPU 必须内生具备的能力。换句话说，AI Agent 时代正在让 CPU 从 " 系统底座 " 升级为 " 系统中枢 "。

C950 的另一层意义，也正是在这里体现出来，那就是赋予 CPU 原生 AI 能力。传统 CPU 架构的 AI 能力，大多是通过外挂加速器实现的——无论是外挂 NPU，还是通过专用 IP 进行扩展，本质上都属于 "CPU + 加速器 " 的组合模式。

而 RISC-V 的优势，在于它天然的可扩展性，使得 AI 能力可以从外挂模块转变为内生能力。通过搭载自研的 Matrix 加速引擎，玄铁 C950 完成了一项此前被认为是不可能完成的任务：在 RISC-V CPU 上跑通了 DeepSeek V3" 满血版 " 和 Qwen3 等千亿参数大模型。实测显示，在 Qwen3 上实现 34 Tokens/s，在 DeepSeek V3 上实现 18 Tokens/s，首 Token 延迟分别约为 3.4 秒和 1.7 秒。

这并不意味着大家明天就要拿一颗纯 CPU 去替代 GPU 集群跑大模型，但它非常清晰地证明了一点：RISC-V CPU 第一次具备了原生支持千亿参数大模型的能力边界，在 AI Agent 时代，RISC-V CPU 完全有能力承担起 " 大脑中枢 " 的重任。

玄铁这次把整个闭环跑通，等于是为行业提供了一个非常重要的范本——你不必从零开始摸索 RISC-V AI 应该怎么做，至少现在，已经有人把第一套可以工作的台阶搭出来了。

孟建熠的一个比喻很形象：如果客户需要爬到 2 米高，那玄铁已经先给出一个 1.5 米的台阶，剩下 50 公分可以由客户自己去做专用化创新。这个比喻其实也点出了玄铁当前的定位：它不是试图替所有客户做完最终产品，而是要先把通用底座和基础能力做扎实，让更多客户能够在其之上低成本、可维护地继续往前走。

顺着这个逻辑，再看玄铁在 AI 上的路线，其实会更清楚。孟建熠讲得很清楚：从 AGI 和系统工程的角度看，RISC-V 当前最应优先突破的仍然是推理，而不是训练。原因不复杂，推理市场更大、商业路径更清晰，尤其是云端推理和端侧 / 边缘推理都已经出现明确需求；而训练不是一颗芯片的问题，而是 Scale up、Scale out、软件栈、网络系统、集群能力一起构成的系统问题，今天的 RISC-V 生态还没有完全做好这一整套。

这也恰恰说明玄铁的路径并不冒进。它并没有简单把 "AI" 变成一个市场口号，而是在清楚地区分：先把通用计算与推理能力做出来，再逐步往更复杂的训练体系推进。这种节奏，本身就比 " 什么都想做 " 更像一个要真正把产业做成的策略。

Flex 平台与 " 定义芯片 " 的时代

当 RISC-V 开始做出高性能通用 CPU 之后，一个老生常谈的问题又来了：既然 Arm 和 X86 也能做高性能 CPU，那 RISC-V 到底真正不同在哪里？RISC-V 的价值究竟好在哪里？

孟建熠表示：这个问题他每天都会被问很多遍。讲开放、讲创新、讲国产趋势、讲大方向，这些都对，但客户真正最在意的是：这个东西适不适合我的产品，它到底能给我带来什么现实价值。如果上层应用感知不到差异，如果终端客户感知不到价值，那这类产品最后都很难形成真正的市场驱动力。

" 要知道客户并不缺一个 " 也能用 " 的架构，客户真正关心的是，你为什么值得我迁移。" 孟建熠坦言。

从这个角度看，玄铁今年一个很重要的变化，不只是继续在底层软件里打转，而是开始更主动地往下游走，去找确定的细分应用场景、找头部客户、找能够形成标杆效应的垂直行业。因为创新必须从应用需求里长出来，产品也必须在应用场景里建立竞争力，否则所谓 " 生态 " 最终只会变成一套自我循环的话术。

这也是为什么玄铁现在强调，不是去喊替代，而是要去做客户有感的价值。去年，达摩院支持了 38 项针对 CPU 的改动，超过一半是为了 AI 加速和存储增强——这说明，标准 CPU 已经不够用了。

" 标准化 " 曾是工业时代的皇冠，但在 AI 碎片化的今天，它正变成一种枷锁。

为此，玄铁推出了 Flex 可扩展平台。

过去，如果客户想做差异化，要么自己从零造核，要么基于开源核重走一遍设计流程。问题在于，通用那部分往往反而最难，因为它涉及复杂的微架构、验证、软件兼容、PPA 平衡，绝大多数客户并不擅长，也没必要在这些重复性环节上耗掉大量资源。真正擅长的，反而是围绕具体应用，把自己最懂的那部分 Know-how 叠加上去。

Flex 平台本质上就是在解决这个矛盾。它提供处理器建模、微架构设计与扩展环境、软件工具链，允许客户在玄铁通用 CPU 基础上进一步做定制化修改。对于 AI 客户来说，可以在通用 CPU 上叠加 Vector、Matrix，甚至继续做自己的私有化扩展；对于其他垂直行业客户来说，也可以围绕可靠性、存储、专用计算等方向做差异化增强。这样一来，客户不需要从零造一个完整核，但又不是只能买一个完全不可改动的黑盒产品。

对很多客户而言，让他从零做一个完整的 RVV 方案可能很难；但如果给他一个成熟的 RVV1.0 底座，再让他往上叠加一些与应用深度结合的私有扩展，他的能力反而会非常强，因为那部分本来就是他最懂的。这种模式，让客户既能享受玄铁兼容 RISC-V 生态带来的红利，又能保留自己在终端市场中的差异化竞争力。

从商业逻辑看，这其实是非常关键的一步。因为它意味着玄铁不是单纯卖一个标准 IP，而是在卖一个 " 通用底座 + 客户可持续创新能力 " 的合作模式。它授权给客户的是一个成熟通用 IP，但客户在其之上开发出来的东西又是自己的，因此双方形成的是长期、共同进化的关系，而不是一次性交付关系。这也是为什么 Flex 不能简单被理解成一个 " 开放平台 " 或 " 可扩展工具链 "。它更像是 RISC-V 的可扩展性第一次被真正商业化、产品化地表达出来。

说得更直白一点，RISC-V 的核心魅力从未仅仅是 " 免费 "，而是 " 可定制 "。Flex 平台让芯片设计从 " 命题作文 " 变成了 " 命题填空 "，赋予了客户定义自己专属 CPU 的最高自由度。

中国开源力量的 " 群星闪耀时 "

大家都知道，英伟达如今的成功离不开 CUDA 飞轮生态的反哺。但在孟建熠看来，RISC-V 要形成自己的生态飞轮，路径并不会简单复制这一模式。

RISC-V 当前所处的发展阶段截然不同。它今天最大的问题，并不是已经有了足够多标准化、高竞争力、开放可用的通用芯片，然后等待生态自然爆发；恰恰相反，它还处在‘好芯片仍然不够多’的阶段。"

这一定义，点出了 RISC-V 生态的关键矛盾。

从表面看，RISC-V 芯片数量已经相当庞大，但其中绝大多数集中在嵌入式与定制化场景，它们对生态的反哺并不强，因为很多应用场景是封闭的、裁剪的、私有化的。它们可以从生态中拿走一些东西，却很难像 X86 通用服务器或标准化 GPU 平台那样，形成大量开发者共同贡献、共同反馈、共同优化的公共土壤。

所以，RISC-V 真正需要的，不只是更多芯片，而是更多开放、标准化、具备竞争力的通用类芯片。只有这类产品足够多，软件开发者才有持续优化的对象，应用厂商才有持续适配的动力，生态的飞轮才可能真正转起来。

从这个角度看，C950 这类产品的价值再次被放大。它不是单纯去多卖一个高端 IP，而是在为 RISC-V 生态制造更多 " 可以被反复使用、反复适配、反复优化 " 的公共基础设施。

而围绕这种 " 基础设施 " 的构建，包括达摩院在内的中国厂商正在逐步从参与者走向塑造者：

一方面，阿里巴巴达摩院与北京开源芯片研究院合作推进下一代开源高性能 RISC-V CPU，持续参与 RISC-V 国际基金会服务器相关标准、BRS、RPMI 以及 Matrix 扩展等方向，说明其已经不只是产品参与者，也在进入标准塑造者的角色；

另一方面，在中国科学院软件研究所发起的 OpenRuyi 社区中，玄铁贡献了 25.27% 的 Patch，排名第一，成为核心推动者。与此同时，会上，中国科学院软件研究所、北京开源芯片研究院与阿里巴巴达摩院的三方战略协同，也标志着从 " 单点突破 " 走向 " 体系化合力 " 的关键一步。

最后，从主导 Server SoC 标准发布，到 Matrix 扩展的社区讨论，中国企业开始在国际舞台掌握话语权。今天很多服务器相关标准、RAS、QOS、可靠性规范仍然不够完善，很多事情玄铁是在 " 边做产品、边推标准 "。玄铁今天在做的并不是简单意义上的 " 做核—授权—收钱 "，而是在替整个 RISC-V 生态先做那些最难、最重、最没人愿意先投的钱和时间。某种程度上，它不是在追一个已经成熟的市场，而是在替这个市场开荒。

" 当真正开放、标准化、具备竞争力的 RISC-V 通用芯片足够多时，生态飞轮才会真正转起来。"孟建熠指出。

但生态的建立，终究不能停留在 " 开源社区热闹、技术圈自嗨 " 的阶段。可以看到，玄铁正在把这套体系进一步向下游应用场景推进，从 " 社区繁荣 " 走向 " 商业落地 "。

无剑联盟就是其中一个很典型的抓手。按照孟建熠的说法，它现在的大趋势是越来越往下游渗透，核心目标不是让大家围着 IP 讨论架构，而是帮助合作伙伴在垂直场景中真正把产品做起来。比首批成员海尔能在在家电体系快速落地 RISC-V，就是借助联盟的全链路力量，把自己的行业 know-how 转化为芯片产品，为创新的 RISC-V 商业范式打样。

从这个意义上说，中国力量从单打独斗到 RISC-V 上的集体会师，最终比拼的已经不只是技术路线是否正确，而是谁能率先把这条路线变成可规模化复制的商业现实。RISC-V 如果只是停留在 " 架构先进、生态开放、理念正确 "，它的产业化速度依然会很慢；但如果它能够在家电、车规、边缘服务器、DPU、交换芯片、AI 推理芯片这些垂直场景中形成一个又一个标杆客户、标杆产品和可复制路径，那么生态才会真正由虚转实。

总结

架构之争从未真正结束，只是过去很长时间里，RISC-V 还没有走到最核心的战场。而现在，随着 C950、AI 平台和 Flex 一起落位，它终于开始真正走上牌桌。

C950 是突破高性能天花板的利刃，Matrix 是在 AI 时代扎下的深根，Flex 则是将 RISC-V " 可定制 " 的灵魂真正商业化。当无剑联盟加速向垂直场景渗透，这场竞争便不再是实验室里的极客理想，而是真实商业世界里的一场范式革命。

15 年寒暑，RISC-V 完成了从边缘到中心的漫长演进。这一次，它不再是靠 " 开源情怀 " 博取关注的后来者，而是一个开始具备同台竞技资格的新选手。x86、Arm、RISC-V " 三足鼎立 " 的算力大航海时代，已然拉开序幕！

* 免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

END

今天是《半导体行业观察》为您分享的第 4355 内容，欢迎关注。

推荐阅读