三易生活 2小时前
手机AI愈发重要,可为何厂商不再宣传NPU算力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

众所周知,对于如今的智能手机行业来说,"AI" 已经成为了各大厂商最常挂在嘴边的宣传点。

一方面,各头部手机品牌目前都会自称有 " 自研 AI 大模型 ",并通过各种各样的 " 性能优化方案 ",在手机上实现了或主打影像、或用于日常生活、或是辅助游戏体验的 "AI 功能 "。

另一方面,纵观上游的芯片厂商,他们在宣发新款 SoC 时,如今也普遍会有关于 NPU 架构改进、能效提升,以及联合各种 AI 大模型做端侧性能优化的演示环节。

但如果大家还记得前些年的智能手机宣发就会意识到一件事,在 " 手机 AI" 还未普及的年代,彼时相关厂商都会在宣发他们的早期 "NPU" 时,明确给出性能(算力)指标。这样一来,尽管那个时候 NPU" 能做的事情 " 非常有限,但消费者起码一眼就能看出不同品牌以及不同代次 SoC 之间,在 NPU 性能上的差异与进步幅度。

相比之下,如今的手机 SoC 性能要强得多,NPU 也更先进、可以支持更多的 " 端侧 AI" 功能了,但各大厂商在宣发时却普遍只会做具体的 " 功能演示 "。所有厂商、其中包括手机厂商和上游芯片厂商,似乎都普遍对于 "NPU 算力数字 " 这个看起来更直观,更能让普通消费者也可以直接对比优劣的参数闭口不谈了。

那么这又是为什么呢?

是 NPU 算力 " 出问题 " 了吗?这样说其实不完全错

基于朴素的常识,大家都知道许多时候当某个数据突然中断公布时,往往就意味着它可能变得不太好看了。

这一点,对于手机里的 NPU 来说似乎也是成立的。比如以高通为例,2019 年的骁龙 855 是首款公开宣传 NPU 算力的产品,当时它的算力是 7TOPs。之后换代的骁龙 865、骁龙 888、骁龙 8 Gen1 官方都有公布这一数据,分别是 15TOPs、26TOPs、52TOPs。

但是在骁龙 8 Gen1 之后,高通方面便不再公布 NPU 的 " 算力数字 "。通过公开技术资料我们得知,2024 年发布的骁龙 8 至尊版,NPU 算力是 80TOPs,到了今年刚刚换代的第五代骁龙 8 至尊版,这个数字则是 100TOPs。

发现了什么问题吗?尽管高通这两代旗舰 SoC 的 NPU 性能,在行业中依然是 " 遥遥领先 ",但这就意味着从骁龙 8 Gen2 到骁龙 8 Gen3 的这两代,NPU 的 " 算力数字 " 进步速度确实可能是慢了下来。

从这份统计数据中就可以看出,高通的 NPU 性能领先幅度很大

当然,这只是高通一家的情况。从我们三易生活掌握的数据来看,其他几家主流手机芯片厂商在 "NPU 算力数字 " 这个方面,可能要比高通更难堪。所以当高通都 " 领头 "、不再公开宣传 NPU 的算力时,其他的 " 友商 " 自然也就更有理由 " 从善如流 " 了。

为什么 NPU 性能进步变慢了?不止关乎芯片设计

从相关数据中不难发现,最早几代手机 SoC 里的 NPU,很明显呈现出几乎每次换代都 " 算力翻倍 " 的态势。到了最近两年,NPU 的 " 算力 " 进步速度,显然就没那么快了。

关于这种现象,一个很容易想到的理由,是早期的 NPU 本身在设计上留了更多 " 余量 ",所以可以做到每次换代算力翻倍。但这种 " 代代翻倍 " 的设计,随着后期半导体制程成本的上涨、再加上厂商需要将更多的功耗分配给新架构的 CPU 和 GPU,所以自然就没法那么 " 任性 " 地维系下去了。

但如果大家有关注过彼时手机厂商的市场宣传就会发现,在他们停止宣传 NPU 的 " 算力数字 " 后,实际上几乎依然会在每次芯片换代时宣称,新的 NPU 比前代 " 性能翻倍 "。

很显然,现在大家已经知道,如今的 NPU 单从 " 硬件算力 " 来看,远远还做不到每次更新都翻倍的地步。那么这个 " 性能翻倍 " 是从何说起的呢?简单来说,这其实是因为过去的 " 手机 AI" 和现在的 " 手机 AI",在技术内涵、或者说所处理的任务类型上,已经发生了很大的变化,所以对 NPU 的设计需求也截然不同了。

举例来说,早期的 " 手机 AI" 几乎都集中在 " 计算视觉 " 领域,比如用摄像头来进行面部识别、拍照时的自动场景优化,甚至包括播放视频时自动画面增强等。这些技术就需要 NPU 有很强的图像信号吞吐量,所以最早的 NPU 几乎完全将重心放在了纯粹的 " 峰值算力 " 上,要的就是在最短的时间里 " 算完 "。由于其余的时候 NPU 很少会参与手机的日常工作,所以能效比差点也无所谓。

但现在的情况已经发生了极大的变化。由于如今手机的 "AI 功能 " 不再局限于计算视觉,而是更多地集中在 " 内容生成 " 方面,比如 AI 生文、AI 生画、甚至包括拍照时用 AI 去 " 生成 " 缺失的细节。再加上 AI 功能越来越多、系统日常调用 NPU 的场合愈发频繁,这就使得现在的 NPU 一方面在底层架构上需要针对生成式 AI 任务做出修改,另一方面它们也必须比过去更注重长时间运行时的能效比。

打个比方来说,最近一些机型已经开始用 NPU 来协助 GPU,进行游戏中的 " 超帧超分 " 处理。很显然,如果这时候 NPU 还采用以前那种 " 爆发式 " 的性能设计思路,肯定是没法满足需求的。

手机的 NPU 还会继续进步吗?会,但思路已然不同

当然,在针对新的 AI 应用需求调整了底层设计后,如今可以看到不管是哪家芯片厂商,他们的 NPU" 硬件性能 " 实际上在最近这两年,还是重新回到了增长的轨道上。只不过由于各种各样的限制,如今的手机 NPU 显然没法像以前那样,做到每一代硬件算力都直接 " 翻番 " 了。

难道说以后就完全没法 " 指望 " 手机里的 NPU,再有大幅度的性能提升吗?

从现有的信息来看,倒也不至于,但肯定不会像以前那样,纯粹靠 " 堆规模 " 和提升频率来解决问题了。比如,部分手机厂商会通过将他们的私有算法 " 固化 " 进 NPU,相当于用算法来直接定制硬件,来提升 NPU 在执行特定任务时的计算效率。

对于更多的品牌来说,与大模型进行技术合作,深度调校 AI 功能在 NPU 上的兼容性和执行速度,也是当下提升 NPU 性能的主要方式。比如就在最近这几天,三星就与 Nota AI 达成合作,要通过软件优化的方式让 Exynos 2500 的 NPU(算力 59TOPs)在实际 AI 执行速度上," 追平 " 第五代骁龙 8 至尊版上的那颗 100TOPs 算力 NPU。

虽然我们对于这样的 " 优化 " 究竟能否实现有点怀疑,但它至少表明,对于如今手机 SoC 里的 NPU 设计来说,软件优化所能实现的效果,甚至可能会比单纯的硬件设计更为重要。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 骁龙 高通 智能手机 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论