从无形IP到AI万象，安谋科技Arm China“周易”X3 NPU 发布！

11 月 13 日，国内领先的芯片 IP 设计与服务提供商安谋科技（中国）有限公司（以下简称 " 安谋科技 Arm China"）今日宣布，在上海举办 " 周易 "X3 NPU IP 新品发布会。作为安谋科技 Arm China"All in AI" 产品战略下诞生的首款重磅产品，以及 "AI Arm CHINA" 战略发展方向的关键实践，" 周易 "X3 NPU IP 基于专为大模型而生的最新 DSP+DSA 架构，致力于打造端侧 AI 计算效率新标杆，在性能、功能与易用性等方面全面跃升，面向基础设施、智能汽车、移动终端、智能物联网四大领域，为加速卡、智能座舱、ADAS（高级驾驶辅助系统）、具身智能、AI PC、AI 手机、智能网关、智能 IPC（网络摄像机）等设备带来前所未有的 AI 计算体验。

安谋科技 Arm China 产品研发副总裁刘浩

安谋科技 Arm China 产品研发副总裁刘浩表示：" 在‘ All in AI ’产品战略的指引下，我们将持续加大投入，以前瞻性视野整合顶尖研发资源，秉持开放合作理念，为生态伙伴提供业界领先的从硬件、软件到服务的端到端解决方案，全力赋能伙伴的产品创新和商业化落地。"

" 周易 "X3 NPU IP 新品发布会现场

性能跃迁

前瞻五年布局，让端侧大模型 " 跑得稳、答得顺 "

在半导体 IP 领域，" 面向未来 5 年的产品方向进行前瞻布局 " 已成为行业共识——涵盖 IP 研发、芯片及终端产品研发量产。安谋科技 Arm China 深谙这一规律，前瞻性地在 " 周易 "X3 中采用兼顾 CNN 与 Transformer 的通用架构设计，支持全算力类型并增强浮点运算 FLOPS，助力实现从定点到浮点计算的关键转变，并满足大模型计算需求，为未来 5 年 Gen AI、Agentic AI 与 Physical AI 的端侧落地奠定技术基石。

随着 AI 大模型技术的飞速发展，智能手机、AI PC 和智能汽车等端侧设备正迎来 AI 能力的爆发性需求。从多模态语音助手到实时图像生成，从智能座舱交互到辅助驾驶决策，端侧设备需要承载越来越复杂的 AI 计算任务。然而，端侧 AI 部署面临算力受限、能效要求高、带宽瓶颈、开发门槛高等多重挑战——如何在有限的功耗和算力资源下实现大模型的高效运行，成为行业亟需突破的关键难题。

" 周易 "X3 基于专为大模型而生的最新 DSP+DSA 架构，从计算效率、带宽、精度适配、任务处理四大维度实现升级，精准解决端侧 AI 大模型运行难题，打造端侧 AI 计算效率的新标杆。

其单 Cluster 最高支持 4 个 Core，拥有 8~80 FP8 TFLOPS 算力且可灵活配置，单 Core 带宽高达 256GB/s。相较于 " 周易 "X2 产品，" 周易 "X3 的 CNN 模型性能提升 30%~50%，多核算力线性度达到 70%~80%。在同算力规格下，AIGC 大模型能力较上一代产品实现 10 倍增长，这得益于 16 倍的 FP16 TFLOPS、4 倍的计算核心带宽、超过 10 倍的 Softmax 和 LayerNorm 性能提升共同驱动。

借助这些优化，端侧大模型推理将更高效：在 Llama2 7B 大模型实测中，" 周易 "X3 NPU IP 在 Prefill 阶段算力利用率高达 72%，并在安谋科技 Arm China 自研的解压硬件 WDC 的加持下，实现 Decode 阶段有效带宽利用率超 100%，远超行业平均水平，满足大模型解码阶段的高吞吐需求。

" 周易 "X3 NPU IP 新品亮点

此外，" 周易 "X3 在架构层面实现了多项创新，集成以下关键特性：

l 集成自研解压硬件 WDC：使大模型 Weight 软件无损压缩后通过硬件解压能获得额外 15%~20% 等效带宽提升。

l 新增端侧大模型运行必备的 W4A8/W4A16 计算加速模式：对模型权重进行低比特量化，大幅降低带宽消耗，支持云端大模型向端侧的高效迁移。

l 集成 AI 专属硬件引擎 AIFF（AI Fixed-Function）与专用硬化调度器：实现超低至 0.5% 的 CPU 负载与低调度延迟，灵活支持端侧多任务场景和任意优先级调度场景，确保高优先级任务的即时响应。

l 支持 int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32 多精度融合计算，强浮点计算：可灵活适配智能手机边缘部署、AI PC 推理、智能汽车等从传统 CNN 到前沿大模型的数据类型需求，平衡性能与能效。

安谋科技 Arm China 产品总监鲍敏祺

安谋科技 Arm China 产品总监鲍敏祺指出：" ‘周易’ X3 遵循‘软硬协同、全周期服务与成就客户’的产品准则，提供从硬件、软件到售后服务的全链路支持，以前瞻性设计、专业团队交付与深度服务投入，全面助力客户产品成功与商业化落地。"

软硬协同

从 " 好用 " 到 " 用好 "，Compass" 金牌辅助 " 提升开发效率

" 周易 "X3 NPU IP 不仅提供高性能硬件，还配套完善易用的 " 周易 "Compass AI 软件平台，通过 " 软硬一体 " 的协同设计，让开发者从 " 好用 " 到 " 用好 "，显著提升开发部署效率。

Compass AI 软件平台通过覆盖开发全流程的工具链、极致的易用性优化与开放的生态布局，破解端侧 AI 开发 " 适配难、周期长、门槛高 " 的痛点。作为核心工具，平台中的 NN Compiler（神经网络编译器）集成 Parser（模型解析）、Optimizer（优化器）、GBuilder（生成器）及 AIPULLM（大模型运行工具），可实现主流模型的高效转化、自动化优化与部署配置生成，并具备以下核心能力：

l 广泛的框架与模型支持：支持超 160 种算子与 270 种模型，兼容 TensorFlow、ONNX、PyTorch、Hugging Face 等主流 AI 框架，提供开箱即用的 Model Zoo。

l 创新的 Hugging Face 模型 " 一键部署 "：通过 AIPULLM 工具链，直接支持 Hugging Face 格式模型，实现 " 一站式 " 转化与部署，极大降低开发门槛。

l 先进的模型推理优化：实现业界领先的大模型动态 shape 支持，高效处理任意长度输入序列；同时提供包括 Tensor/Channel/Token Level 多样量化方式，以及 GPTQ 等大模型主流量化方案，并增加对 LLM/VLM/VLA 及 MoE 等模型的高性能支持，保障推理精度并实现云到端快速迁移。

l 灵活的开发者赋能：提供多种开放接口，支持用户模型与自定义算子的开发与调试；配备丰富的调试工具与 Bit 精度软件仿真平台，支持多层次白盒开发与性能调优，极大简化算法移植与部署。

l 全面的系统与异构兼容：支持 Android、Linux、RTOS、QNX 等多种操作系统，并通过 TVM/ONNX 实现 SoC 异构计算，高效调度 CPU、GPU、NPU 等计算资源。

安谋科技 Arm China 积极构建开放生态，Compass AI 软件平台中的 Parser、Optimizer、Linux Driver、TVM 及内部 IR 格式等核心组件已相继开源，并拥有丰富的调试工具，可满足开发者白盒部署需求，且支持更易用的 DSL 算子编程语言。在此基础上，平台赋予开发者更深度的定制能力：客户不仅可以使用平台中的 Compiler、Debugger 或 DSL 语言开发出自己的自定义算子，也可通过 Parser、Optimizer 等工具打造出属于自己的模型编译器，从而实现差异化设计与开发效率提升。

" 周易 "NPU Compass AI 软件平台

不仅如此，安谋科技 Arm China 技术团队还围绕 " 周易 "X3 NPU IP 和 Compass AI 软件平台的软硬件协同进行精心设计和反复论证，目标是提升客户最终落地方案的效率和能效。例如，在 " 周易 "X3 NPU IP 的 AIFF 模块软硬件设计中，硬件端充分结合软件使用场景，通过增大总线带宽、增加 DMA（直接内存访问）的 outstanding（未处理的指令或数据请求）等方式提升数据搬运、数据并行效率，软件端则针对硬件特性设计专属使用模式，如对模型进行合理切分以充分发挥多核并行优势。

安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士

安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士认为：" ‘周易’ X3 的产品优势，源于通用、灵活、高效且软硬协同的系统架构设计，这一设计使其兼具广泛的行业适用性与灵活的边端侧 AI 应用场景匹配能力。"

多场景落地

从无形 IP 到 AI 万象，端侧智能触手可及

新一代 " 周易 "X3 NPU IP 将端侧智能的边界拓展至更广阔的应用场景，面向基础设施、智能汽车、移动终端、智能物联网四大领域，精准匹配当前爆发的端侧 AI 需求，可广泛应用于加速卡、智能座舱、ADAS、具身智能、AI PC、AI 手机、智能网关、智能 IPC 等 AI 设备：

l 基础设施领域：在加速卡场景中，" 周易 "X3 NPU IP 支持 CNN 与大模型等多样结构的 AI 模型高效加速，为数据中心及边缘计算节点提供核心算力。

l 智能汽车领域：" 周易 "X3 NPU IP 同时赋能智能驾驶与智能座舱：在 ADAS 系统中，可为自动泊车等辅助驾驶功能提供高性能 AI 算力支持；在 IVI（车载信息娱乐系统）中，支持基于语音与车内外视频图像输入的智能互动。

l 移动终端领域：在 AI PC、AI 手机上，" 周易 "X3 NPU IP 可实现超分渲染，提升显示分辨率，并支持基于大模型的 AI Agent 应用，为用户带来更智能、更流畅的交互体验。

l 智能物联网领域：在智能网关、智能 IPC 等设备中，" 周易 "X3 NPU IP 支持本地 AI 推理，实现更快响应与更智能的终端体验，满足边缘设备对实时性与隐私保护的高要求。

" 周易 "NPU IP 系列家族现场 demo 展示区

此次发布会现场系统展示了 " 周易 "NPU 产品家族的技术演进与落地成果，生动诠释其如何将无形的算力转化为触手可及的智能体验。

l " 周易 "Z1：算力 0.32~3.75 TOPS，赋能 AIoT 场景，广泛支持人脸识别、人脸及人体关键点检测和文字识别等，且已进入 AI 智能音箱等多种产品。

l " 周易 "Z2/Z3：算力 1.25~5 TOPS，面向 AIoT、入门级座舱等市场，支持前视辅助驾驶方案、舱泊一体方案及安全仪表盘方案，以及图像超分辨率优化等。

l " 周易 "X1：算力 10 TOPS，面向高端 AIoT、汽车座舱等市场，支持驾驶员监控、乘客监控、自动泊车、AVM 360 环视，以及 AI 图像降噪等。

l " 周易 "X2：算力 10-30 TOPS，面向高端 AIoT、AI PC、AI Pad、手机等市场，现场展示了运行 Stable Diffusion v1.5 的文生图能力，运行 CLIP 的文搜图能力，可实现端侧多模态 AI 流畅运行。

l " 周易 "X3：算力 8-80 FP8 TFLOPS，面向基础设施、智能汽车、移动终端、AIoT 等市场，现场展示了基于 " 周易 "X3 的主流大模型效果，包括运行 DeepSeek-R1-Distill-Qwen-1.5B 模型的文生文 AI 流畅对话，运行 Stable Diffusion v1.5 的文生图效果，运行 MiniCPM v2.6 模型的图片识别及图生文多模态应用等，均展现出优异的端侧大模型推理性能。

从 " 周易 "Z1 的基础感知到 " 周易 "X3 的复杂认知，这一技术演进路径清晰地表明，端侧 AI 正在从单一的功能实现，迈向融合多种模型、适应动态场景的 " 全民普及 " 新阶段。" 周易 "X3 NPU IP 的设计充分预判端侧 AI 的 " 场景深化 " 趋势：以极致算力表现破解 " 多模型融合 " 的算力需求，以全算力类型并增强浮点运算 FLOPS 适配 " 精度动态演变 " 的场景差异，借助软硬协同的生态打造端侧算力底座。

" 周易 "X3 NPU IP 的发布，标志着安谋科技 Arm China"All in AI" 产品战略的正式开启。安谋科技 Arm China 以 "AI Arm CHINA" 为战略发展方向，积极响应 "AI+" 行动计划，持续深耕技术领域创新，同时携手伙伴共建开放生态，加快构建国内 "AI+" 产业升级的智能计算基石，为千行百业智能化转型提供更强 IP" 核芯 " 动力。

宙世代

一起剪

相关标签