智东西
作者 | 云鹏
编辑 | 漠影
今天,AI 正给整个手机产业带来巨大影响和变革,从底层芯片到操作系统,再到上层应用生态,几乎都在被 AI 重构。
越来越复杂的模型、越来越强大的 AI Agent,都对计算效率、延迟、功耗、内存带宽等方面提出了新的挑战。
从苹果到三星、联发科、小米,手机芯片玩家们都在加速 AI 能力在芯片端的集成,上周苹果刚刚发布的 A19 芯片,直接在 GPU 的每一个核心中都塞入了一颗神经网络加速器。
芯片底层技术创新,是加速端侧 AI 落地、推动 AI 手机体验升级的核心支撑。在这样的行业趋势下,芯片底层技术领域的核心玩家 Arm 再次向行业抛出一枚 AI 重磅大招。
近日,Arm 在上海正式亮出了旗舰级 Arm Lumex 计算子系统(CSS)平台,这也是 Arm CSS 平台的一次重要更名和升级。
Arm Lumex 包括新的 CPU、GPU、DSU 等模块,在性能、能效显著提升的同时,突破性地将第二代可伸缩矩阵扩展(SME2)技术引入到 CPU 中,这也是这类技术首次在安卓手机芯片中落地。而据笔者了解,苹果芯片 CPU 中使用的仍然是第一代 SME 技术。
Arm 特别强调称,这是一个完整的 "AI 优先 " 的平台。
今天,AI 正成为全行业瞄准的核心方向,而面向这一新时代,Arm 的计算平台正成为 AI 与个人计算发展不可或缺的计算底座。此次 Arm 重磅技术升级背后有哪些关键思考、对产业和消费者有哪些价值和意义?我们将一起深入挖掘。
一、CPU 装上 "AI 加速器 ",携手支付宝、vivo 等企业,让端侧 AI 从 " 能用 " 到 " 好用 "
AI 手机经过近两年的迭代,在发展方向和 AI 功能种类上已经基本达成行业共识。今天各家的重点毫无疑问是端侧 AI 体验的优化。在端云结合的混合 AI 成为基础模式之下,如何更高效地在手机上落地模型、如何在手机上实现更佳的 AI 应用体验,成为需要行业共同破解的难题。
纵观 Arm 整场发布会,AI 是当下 Arm 技术迭代围绕的核心主题,正如 Arm 高级副总裁兼终端事业部总经理 Chris Bergey 所说,新的 Arm Lumex 是一个 "AI 优先 " 的平台。
如何实现 AI 优先,Arm 此次最核心的改进是将 SME2 技术引入了 CPU 中。
在 5 倍性能提升、3 倍能效提升这些亮眼数字的背后,Arm 实际上在做的就是给 CPU 这一手机中最核心、通用性最强的模块配备新的矩阵加速器,让 AI 时代的各类复杂计算变得更快、更省电,进而让我们能在智能手机上获得更好的 AI 体验。
目前,SME2 这一技术已经获得了阿里巴巴、支付宝、三星 System LSI、腾讯、vivo 等科技领域头部企业的支持和采用。基于 SME2 技术,Arm 与这些合作伙伴深度合作,已经在诸多 AI 应用中实现了直观的升级。
总体来看,这种 AI 体验的升级最突出的特点就是让 AI 功能从 " 能用 " 到 " 好用易用 " 前进了一大步。
如何去定义 " 好用易用 " 呢?就是要让设备 " 更懂你 ",且能 " 无缝响应 "。
手机行业的创新与竞争,是最贴近用户应用场景的领域之一。过去卷摄影、快充等,是优化单点场景痛点;如今在 AI 时代,生成式 AI 应用以及 AI 与计算摄影、通信、性能等各领域的融合成为焦点,其本质是用 AI 重构各场景价值,实现从 " 被动响应 " 到 " 主动服务 " 的转变。
我们在现场看到了一项 " 智能瑜伽教练 " 的演示,在演示中,AI 教练可以快速流畅地将文本转换为语音进行输出,据称其生成速度提升了 2.4 倍之多,这样用户就可以在健身过程中即时获得姿势反馈与指导,并且全程都不用担心设备的电池续航问题。
智能瑜伽教练
其实 AI 健身教练类似功能我们并不陌生,但让 AI 真正能够像真人一样快速、准确、高效地与我们进行交流、交互,仍是产业持续努力的目标,Arm 无疑将这一愿景向现实推近了一大步。
在 Arm 与支付宝和 vivo 的三方深度合作中,AI 手机体验的升级给我带来了更多惊喜。
支付宝端侧 AI 引擎 xNN 集成了 SME2 技术,在 vivo 的旗舰智能手机上完成了基于 Arm SME2 技术的大语言模型推理验证,在预填充与解码阶段,性能分别实现了超过 40% 和 25% 的提升,大语言模型交互响应时间缩短了 40%。据称,在 SME2 加持下,vivo 手机实现了额外 20% 的性能提升。
从应用效果来看,vivo 手机在一些视觉、语音、文本等 AI 计算任务中,性能都实现了显著加速,比如在全局离线翻译这样的真实场景中,AI 响应时间明显加快,让整个翻译的过程更加流畅自然。
本地离线实时翻译
可以说,这些翻倍式的改善,都标志着 CPU 后端能力的重大突破,证明了 SME2 可为终端设备带来更快的实时生成式 AI 体验,端侧 AI 的各类本地功能,都得到了显著提升。
再来看看用户非常看重的计算摄影。搭载 SME2 单核心运行神经摄像头降噪功能,可以在 1080P 分辨率下实现每秒 120 帧的超高帧率,即使在 4K 高分辨率下,也能实现每秒 30 帧的帧率表现。这意味着,我们日常使用手机拍照,即使在光线昏暗的场景中,也可以拍出更加清晰、锐利的照片。
纵观此次发布的产品和技术,从 CPU、GPU 到软件库的一系列升级,都让我们看到了 Arm Lumex 在 AI 时代给厂商、开发者、消费者带来的价值。
而对于开发者而言,从软件工具到生态层面的完善支持更能让他们迅速将这些新技术与自身的产品相结合,将 AI 创新成果更快推向市场。
根据 Arm 预测,到 2030 年,SME 与 SME2 技术将为全球超过 30 亿台设备新增超 100 亿 TOPS 的计算能力,端侧 AI 性能呈现指数级提升。
二、深耕计算数十年,年均两位数 IPC 提升,用技术和生态领跑行业
今天,我们看到 Arm 基于底层技术创新实现了移动设备端侧 AI 性能的大幅提升,实现这一切,一方面源于 Arm 的技术硬实力,另一方面也源于数十年来 Arm 在移动技术和生态领域的持续引领,在技术和产业发展的关键节点,Arm 始终跑在前列。
从技术演进来看,Arm 对 AI 的布局实际已持续十余年:Armv8 架构时代,通过优化 NEON 模块以提升 AI 效率;Armv9 架构引入 SVE2 与 SME 以适配更多 AI 场景;到 Armv9.3-A 架构时代,集成 SME2 技术,优化现代 AI 工作负载的吞吐量、延迟与精度。Arm 通过架构层面改进 SoC 设计,为 AI 应用的爆发提前蓄力。
如今,智能设备的海量爆发让计算变得无处不在,从手机、PC、汽车到各类 AIoT 设备,万物智联的趋势变得愈发显著。与此同时,产业对能效比的极致追求、对功耗的死磕、对大模型的支持优化、对 AI 算力的需求都成为行业共同面对的挑战—— Arm 终于等到了 AI 的东风。
回到手机行业,如果只是架构上的革新,还不足以跟上端侧 AI 应用的步伐。ArmLumex 计算子系统(CSS)平台给出了新的解题思路,它从系统性层面,集成搭载 SME2 技术的最高性能 Arm CPU、GPU 及系统 IP,加速端侧 AI 的落地和普及。
软件工具和生态层面,KleidiAI 已经集成至所有主流移动操作系统及 AI 框架中。开发者能在各类 Arm 设备上获得最佳 AI 性能,无需进行任何额外操作。
纵观手机行业的发展,Arm 一直跑在技术浪潮的最前沿。每一个版本更新都为行业注入新的活力,给行业玩家提供最坚实的底层技术 " 资源池 "。Arm 及其生态系统在奠定计算基础方面所做的努力,让行业能够时刻把握新兴的机遇。
三、从手机 PC 到全生态,算力产业激变,模式转型构筑 " 核心基石 "
今天,AI 新浪潮正在快速席卷整个科技行业。
终端大厂们纷纷 "All in AI",从产品到服务围绕 AI 升级;大模型迭代从半年更、月更到今天的周更,竞争进入白热化阶段;底层芯片层,各路芯片厂商都在产品中密集融入 AI 新特性。
从手机、PC、汽车、物联网到数据中心,从十亿级、百亿级到万亿级、数十万亿级模型,AI 正在快速重构各行业各领域,同时也给计算产业也带来了新的挑战和机遇。
Arm 显然是在这股 AI 浪潮中行动颇为积极的一家。作为驱动 AI 应用的技术基石,不论是要快速上市兑现性能价值,还是要深度设计配置,从高端智能手机、PC 到新兴 AI 智能设备,Arm 总能帮助厂商找到峰值性能、持续能效与芯片面积之间的灵活平衡 " 甜点 "。
AI 浪潮之下,曾深耕幕后的底层技术厂商正逐步走向台前,以核心技术重塑产业格局。
全力冲刺 AI 的 Arm,从技术到生态,从产品到服务,已经全面做好了准备。
结语:打牢 AI 时代计算根技术,端侧 AI 提速
今天,从安卓到苹果生态,端侧 AI 的快速发展需要更多底层技术创新的支撑,AI 应用体验仍有较大提升空间,Arm Lumex 的发布,给行业提供了一套扎实的计算平台基础,让厂商和开发者们面对 AI 这场硬仗有更充足的弹药。
未来,AI 手机之战会愈发焦灼,芯片层的创新仍然会长期是行业竞争的焦点领域。从厂商到开发者,面对 AI 时代的机遇和挑战,Arm 生态已经成为 AI 创新的肥沃土地。
登录后才可以发布评论哦
打开小程序可以发布评论哦