AMD 自上代 Zen 4 开始支持 AVX-512 指令集,但那是使用 256 位 SIMD 用两个时钟周期来执行 AVX-512 指令的,而 Zen 5 则可提供完整的 512 位数据位宽,根据我们首发测试,锐龙 9 9950X 的 AVX-512 计算性能几乎是锐龙 9 7950X 的两倍。当然了 AVX-512 指令在日常的应用范围偏窄,但它确实可以显著提高多种工作负载的性能,但在以往的认知中,调用 AVX-512 指令会让 CPU 功耗大增并让工作频率下降。
根据InstLatX64的测试,采用 Zen 5 架构的 AMD 锐龙 9000 系列处理器在 AVX-512 负载中并不会出现频率大幅度下降和功率大增的情况,锐龙 9 9950X 在使用 AVX-512 负载时,CPU 主频会从 5700MHz 降低至 5300MHz,大概降低了 10%,而在 Intel 旧的 Skylake-X 上使用 AVX-512 通常会导致频率大幅下降,当然这情况在 Rocket Lake 以及 Ice Lake 之后的处理器上就不在出现了,甚至在 12 代酷睿之后的消费级产品 AVX-512 甚至都没了。
AMD Zen 5 架构处理器有四个用于 AVX-512 的全宽 512 位执行单元,而旧的 Zen 4 架构则使用两个 AVX-256 单元来执行 512 位指令,这使得 Zen 5 执行这类指令非常高效,但这设计确实增大了芯片面积。此外,款数据路径本身就很耗电,因此锐龙 9000 处理器在执行 AVX-512 指令时会消耗多多少电还有待观察。
对于高性能台式机、工作站和服务器通常用于处理器来自 AI 和 HPC 领域的各种矢量工作负载,因此 AMD 设计用于台式机和服务器的 Zen 5 架构时,完整的 AVX-512 算力非常重要,但对于移动处理器来说就不是这样了,tomshardware表示用与移动处理器的 Strix Point 其实和 Zen 4 一样用两个 AVX-256 单元来执行 AVX-512 指令。
虽然同是 Zen 5 架构但使用两种不同的方法实现 AVX-512 可能会让开发者和用户感到困惑,但 AMD 通过这样的设计让 Strix Point 核心变得更加紧凑,从而可塞下更多的核心,而更多的核心可为用户带来更高的 AVX-512 性能。
登录后才可以发布评论哦
打开小程序可以发布评论哦