公众号记得加星标⭐️,第一时间看推送不会错过。

在 "AI+" 浪潮席卷全球、半导体产业迎来深刻变革的当下,端侧智能设备对 AI 计算的需求正呈爆发式增长。从智能汽车的辅助驾驶决策到 AI PC 的多模态交互,从物联网设备的实时推理到移动终端的大模型应用,算力受限、带宽瓶颈、开发门槛高等问题,成为制约端侧 AI 规模化落地的核心痛点。
在这一背景下,NPU 作为 AI 计算的专用引擎,正成为推动端侧智能落地的关键力量。
" 周易 "X3 NPU IP,以软硬协同新架构引领端侧 AI 进化
2025 年 11 月 13 日,安谋科技在上海正式举办 " 周易 "X3 NPU IP 新品发布会,以 "All in AI" 的战略决心,推出专为大模型而生的新一代 NPU IP,为端侧 AI 计算效率树立全新标杆。

" 周易 "X3 NPU IP 新品发布会现场
作为安谋科技 "AI Arm CHINA" 战略发展方向的关键实践," 周易 "X3 NPU IP 的发布并非偶然。

安谋科技 Arm China 产品研发副总裁刘浩
安谋科技 Arm China 产品研发副总裁刘浩表示:" 在‘ All in AI ’产品战略的指引下,我们将持续加大投入,以前瞻性视野整合顶尖研发资源,秉持开放合作理念,积极适配主流模型与 OS,为生态伙伴提供业界领先的从硬件、软件到技术服务的全流程解决方案,全力赋能伙伴的产品创新和商业化落地。"

自 2018 年布局 NPU 领域以来,安谋科技已成功交付 5 代 NPU 产品并实现终端商业落地,本土全栈式研发团队的技术积累,为 " 周易 "X3 的跨越式升级奠定了坚实基础。

硬件架构革新:从定点到浮点,专为大模型优化
据介绍," 周易 "X3 最核心的突破在于采用专为大模型设计的最新 DSP+DSA 架构,完成了从定点到浮点计算的关键转变,构建起通用 + 专用的融合架构。

安谋科技 Arm China 产品总监鲍敏祺
安谋科技 Arm China 产品总监鲍敏祺表示,其单 Cluster 最高支持 4 个 Core,具备 8 – 80 FP8 TFLOPS 的灵活算力配置,单 Core 带宽高达 256GB/s,配合自研解压硬件 WDC,能让大模型 Weight 软件无损压缩后获得额外 15%-20% 的等效带宽提升,彻底破解端侧带宽瓶颈。

针对端侧大模型运行需求," 周易 "X3 新增 W4A8/W4A16 计算加速模式,通过低比特量化大幅降低带宽消耗,支持云端大模型向端侧高效迁移。集成的 AI 专属硬件引擎 AIFF 与专用硬化调度器,更实现了超低至 0.5% 的 CPU 负载与低调度延迟,可灵活应对多任务并行场景和任意优先级调度需求,显著提升处理能力。
软件生态开放:让 AI 开发从 " 好用 " 到 " 用好 "
众所周知,硬件的强大性能,需要完善的软件生态来充分释放。
在软件层面," 周易 "X3 搭载全新升级的 Compass AI 软件平台,聚焦开放、易用、高效等核心指标,构建起覆盖开发全流程的工具链,破解端侧 AI 开发 " 适配难、周期长、门槛高 " 的痛点。平台广泛兼容 TensorFlow、PyTorch、Hugging Face、ONNX 等主流 AI 框架,同时原生支持 Hugging Face 模型库,通过 AIPULLM 工具链实现大模型实现 " 一站式 " 转化与部署,极大降低开发门槛。

据悉,在模型支持方面,Compass AI 平台已覆盖超 160 种算子与 270 多种模型,包括 LLM、VLM、VLA 及 MoE 等前沿模型,支持 GPTQ 等主流量化方案和 Tensor/Channel/Token Level 多样量化方式。
更重要的是,平台已将 Parser、Optimizer、Linux Driver 等核心组件开源,提供丰富的调试工具和易用的 DSL 算子编程语言,允许客户开发自定义算子或打造专属模型编译器,实现差异化设计,进而帮助客户与开发者提升开发效率。

" 周易 "X3 NPU IP 亮点
鲍敏祺指出:" ‘周易’ X3 遵循‘软硬协同、全周期服务与成就客户’的产品准则,提供从硬件、软件到售后服务的全链路支持,以前瞻性设计、专业团队交付与深度服务投入,全面助力客户产品成功与商业化落地。"
在软硬协同的深度优化下," 周易 "X3 在实际测试中表现卓越:CNN 模型性能较上一代 " 周易 "X2 产品提升 30%-50%,多核算力线性度达 70%-80%;同算力规格下,AIGC 大模型能力提升 10 倍,Llama2 7B 大模型 Prefill 阶段算力利用率高达 72%,Decode 阶段有效带宽利用率超 100%,充分释放硬件潜力,远超行业平均水平。
此外," 周易 "X3 支持 int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32 等多精度融合计算,能灵活适配从传统 CNN 到前沿大模型的多样化数据类型需求,平衡性能与能效,为不同场景的 AI 应用提供精准算力支持。
多场景全面赋能:从无形 IP 到 AI 万象

安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士
针对 " 周易 "X3 NPU IP 架构,安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士在分享中强调:" ‘周易’ X3 的产品优势,源于通用、灵活、高效且软硬紧密协同的系统架构设计,这一设计使其兼具广泛的行业适用性与灵活的边端侧 AI 应用场景匹配能力。"

软硬件的深度协同,让 " 周易 "X3 不仅能提供极致算力,更能让开发者高效发挥硬件潜力,加速 AI 应用落地。据悉," 周易 "X3 NPU IP 的应用场景已全面覆盖基础设施、智能汽车、移动终端、智能物联网四大核心领域,为各类 AI 设备注入强劲算力。

在基础设施领域," 周易 "X3 NPU IP 支持 CNN 与大模型等多样结构的 AI 模型加速,为数据中心及边缘计算节点提供核心算力;在智能汽车领域,既可为 ADAS 系统的自动泊车功能提供高性能 AI 算力,也能支持 IVI 系统的语音与视频智能互动;在移动终端领域,可实现 AI PC、AI 手机的超分渲染,并支持基于大模型的 AI Agent 应用;在智能物联网领域,为智能网关、智能 IPC 等设备提供本地 AI 推理能力,提升响应速度并保障隐私安全。
在发布会现场的 Demo 区,安谋科技还系统展示了 " 周易 "NPU 产品家族的技术演进路径与落地成果:从 Z1 系列赋能 AIoT 基础感知,到 X2 系列实现端侧多模态 AI 流畅运行,再到 X3 系列展现主流大模型的文生文、文生图、图生文等复杂认知能力,端侧 AI 正从单一功能实现迈向全民普及的新阶段。

" 周易 "NPU IP 系列家族现场 demo 展示区
展望未来,安谋科技在 NPU 架构领域的演进方向清晰明确:将持续强化计算架构的通用计算能力与扩展能力,提升单核 Scale-up/Down 与多核 Scale-out 性能,探索多 Die、多 Chip 协同技术;软件层面将优化编程模型,打造更友好的软件使用界面与层次化完备的接口,支持更多数据格式与网络结构;同时将深化开放生态布局,拓展更多合作模式,推动软硬件协同开发与高效部署。

深耕本土创新,共筑 AI 产业基石
整体来看,作为国内领先的芯片 IP 设计与服务提供商,安谋科技始终坚持本土研发与开放创新,致力于为中国智能计算 " 芯 " 生态的发展助力赋能。
从 2018 年组建国内最早的 NPU 研发团队之一,到如今形成覆盖 Z 系列与 X 系列的 NPU 技术演进路径与产品矩阵,安谋科技的每一步都紧扣行业需求,以技术创新破解产业痛点。
本次 " 周易 "X3 NPU IP 的发布,标志着安谋科技 "All in AI" 产品战略的全面落地。在 "AI+" 行动计划的指引下,安谋科技将继续深耕技术创新,连接全球前沿技术,携手生态伙伴共建开放、共赢的产业生态,为国内 "AI+" 产业升级构建坚实的智能计算基石,为千行百业的智能化转型注入更强 IP" 核芯 " 动力。
* 免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


登录后才可以发布评论哦
打开小程序可以发布评论哦