安谋科技Arm China“周易”X3 NPU IP，树立端侧AI新标杆！

公众号记得加星标⭐️，第一时间看推送不会错过。

在 "AI+" 浪潮席卷全球、半导体产业迎来深刻变革的当下，端侧智能设备对 AI 计算的需求正呈爆发式增长。从智能汽车的辅助驾驶决策到 AI PC 的多模态交互，从物联网设备的实时推理到移动终端的大模型应用，算力受限、带宽瓶颈、开发门槛高等问题，成为制约端侧 AI 规模化落地的核心痛点。

在这一背景下，NPU 作为 AI 计算的专用引擎，正成为推动端侧智能落地的关键力量。

" 周易 "X3 NPU IP，以软硬协同新架构引领端侧 AI 进化

2025 年 11 月 13 日，安谋科技在上海正式举办 " 周易 "X3 NPU IP 新品发布会，以 "All in AI" 的战略决心，推出专为大模型而生的新一代 NPU IP，为端侧 AI 计算效率树立全新标杆。

" 周易 "X3 NPU IP 新品发布会现场

作为安谋科技 "AI Arm CHINA" 战略发展方向的关键实践，" 周易 "X3 NPU IP 的发布并非偶然。

安谋科技 Arm China 产品研发副总裁刘浩

安谋科技 Arm China 产品研发副总裁刘浩表示：" 在‘ All in AI ’产品战略的指引下，我们将持续加大投入，以前瞻性视野整合顶尖研发资源，秉持开放合作理念，积极适配主流模型与 OS，为生态伙伴提供业界领先的从硬件、软件到技术服务的全流程解决方案，全力赋能伙伴的产品创新和商业化落地。"

自 2018 年布局 NPU 领域以来，安谋科技已成功交付 5 代 NPU 产品并实现终端商业落地，本土全栈式研发团队的技术积累，为 " 周易 "X3 的跨越式升级奠定了坚实基础。

硬件架构革新：从定点到浮点，专为大模型优化

据介绍，" 周易 "X3 最核心的突破在于采用专为大模型设计的最新 DSP+DSA 架构，完成了从定点到浮点计算的关键转变，构建起通用 + 专用的融合架构。

安谋科技 Arm China 产品总监鲍敏祺

安谋科技 Arm China 产品总监鲍敏祺表示，其单 Cluster 最高支持 4 个 Core，具备 8 – 80 FP8 TFLOPS 的灵活算力配置，单 Core 带宽高达 256GB/s，配合自研解压硬件 WDC，能让大模型 Weight 软件无损压缩后获得额外 15%-20% 的等效带宽提升，彻底破解端侧带宽瓶颈。

针对端侧大模型运行需求，" 周易 "X3 新增 W4A8/W4A16 计算加速模式，通过低比特量化大幅降低带宽消耗，支持云端大模型向端侧高效迁移。集成的 AI 专属硬件引擎 AIFF 与专用硬化调度器，更实现了超低至 0.5% 的 CPU 负载与低调度延迟，可灵活应对多任务并行场景和任意优先级调度需求，显著提升处理能力。

软件生态开放：让 AI 开发从 " 好用 " 到 " 用好 "

众所周知，硬件的强大性能，需要完善的软件生态来充分释放。

在软件层面，" 周易 "X3 搭载全新升级的 Compass AI 软件平台，聚焦开放、易用、高效等核心指标，构建起覆盖开发全流程的工具链，破解端侧 AI 开发 " 适配难、周期长、门槛高 " 的痛点。平台广泛兼容 TensorFlow、PyTorch、Hugging Face、ONNX 等主流 AI 框架，同时原生支持 Hugging Face 模型库，通过 AIPULLM 工具链实现大模型实现 " 一站式 " 转化与部署，极大降低开发门槛。

据悉，在模型支持方面，Compass AI 平台已覆盖超 160 种算子与 270 多种模型，包括 LLM、VLM、VLA 及 MoE 等前沿模型，支持 GPTQ 等主流量化方案和 Tensor/Channel/Token Level 多样量化方式。

更重要的是，平台已将 Parser、Optimizer、Linux Driver 等核心组件开源，提供丰富的调试工具和易用的 DSL 算子编程语言，允许客户开发自定义算子或打造专属模型编译器，实现差异化设计，进而帮助客户与开发者提升开发效率。

" 周易 "X3 NPU IP 亮点

鲍敏祺指出：" ‘周易’ X3 遵循‘软硬协同、全周期服务与成就客户’的产品准则，提供从硬件、软件到售后服务的全链路支持，以前瞻性设计、专业团队交付与深度服务投入，全面助力客户产品成功与商业化落地。"

在软硬协同的深度优化下，" 周易 "X3 在实际测试中表现卓越：CNN 模型性能较上一代 " 周易 "X2 产品提升 30%-50%，多核算力线性度达 70%-80%；同算力规格下，AIGC 大模型能力提升 10 倍，Llama2 7B 大模型 Prefill 阶段算力利用率高达 72%，Decode 阶段有效带宽利用率超 100%，充分释放硬件潜力，远超行业平均水平。

此外，" 周易 "X3 支持 int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32 等多精度融合计算，能灵活适配从传统 CNN 到前沿大模型的多样化数据类型需求，平衡性能与能效，为不同场景的 AI 应用提供精准算力支持。

多场景全面赋能：从无形 IP 到 AI 万象

安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士

针对 " 周易 "X3 NPU IP 架构，安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士在分享中强调：" ‘周易’ X3 的产品优势，源于通用、灵活、高效且软硬紧密协同的系统架构设计，这一设计使其兼具广泛的行业适用性与灵活的边端侧 AI 应用场景匹配能力。"

软硬件的深度协同，让 " 周易 "X3 不仅能提供极致算力，更能让开发者高效发挥硬件潜力，加速 AI 应用落地。据悉，" 周易 "X3 NPU IP 的应用场景已全面覆盖基础设施、智能汽车、移动终端、智能物联网四大核心领域，为各类 AI 设备注入强劲算力。

在基础设施领域，" 周易 "X3 NPU IP 支持 CNN 与大模型等多样结构的 AI 模型加速，为数据中心及边缘计算节点提供核心算力；在智能汽车领域，既可为 ADAS 系统的自动泊车功能提供高性能 AI 算力，也能支持 IVI 系统的语音与视频智能互动；在移动终端领域，可实现 AI PC、AI 手机的超分渲染，并支持基于大模型的 AI Agent 应用；在智能物联网领域，为智能网关、智能 IPC 等设备提供本地 AI 推理能力，提升响应速度并保障隐私安全。

在发布会现场的 Demo 区，安谋科技还系统展示了 " 周易 "NPU 产品家族的技术演进路径与落地成果：从 Z1 系列赋能 AIoT 基础感知，到 X2 系列实现端侧多模态 AI 流畅运行，再到 X3 系列展现主流大模型的文生文、文生图、图生文等复杂认知能力，端侧 AI 正从单一功能实现迈向全民普及的新阶段。

" 周易 "NPU IP 系列家族现场 demo 展示区

展望未来，安谋科技在 NPU 架构领域的演进方向清晰明确：将持续强化计算架构的通用计算能力与扩展能力，提升单核 Scale-up/Down 与多核 Scale-out 性能，探索多 Die、多 Chip 协同技术；软件层面将优化编程模型，打造更友好的软件使用界面与层次化完备的接口，支持更多数据格式与网络结构；同时将深化开放生态布局，拓展更多合作模式，推动软硬件协同开发与高效部署。

深耕本土创新，共筑 AI 产业基石

整体来看，作为国内领先的芯片 IP 设计与服务提供商，安谋科技始终坚持本土研发与开放创新，致力于为中国智能计算 " 芯 " 生态的发展助力赋能。

从 2018 年组建国内最早的 NPU 研发团队之一，到如今形成覆盖 Z 系列与 X 系列的 NPU 技术演进路径与产品矩阵，安谋科技的每一步都紧扣行业需求，以技术创新破解产业痛点。

本次 " 周易 "X3 NPU IP 的发布，标志着安谋科技 "All in AI" 产品战略的全面落地。在 "AI+" 行动计划的指引下，安谋科技将继续深耕技术创新，连接全球前沿技术，携手生态伙伴共建开放、共赢的产业生态，为国内 "AI+" 产业升级构建坚实的智能计算基石，为千行百业的智能化转型注入更强 IP" 核芯 " 动力。

* 免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

宙世代

一起剪

相关标签