自从苹果在 10 月份发布了搭载 M4 Pro 和 M4 Max 的 MacBook Pro 后,M4 系列芯片的性能表现就引起了很多关注。但是,了解苹果产品线的朋友都知道,M4 系列还有一个隐藏 BOSS —— M4 Ultra 尚未发布。
虽然 Ultra 型号缺席了前代 M3 系列,但是 M2 Ultra 的性能却给大家留下了深刻印象,加上很早之前就曝光 M4 Ultra 已经流片,无疑让人们对这颗苹果的真 · 旗舰芯片性能有了很大期待。
在海外媒体的推算中,如果 M4 Ultra 采用与 M2 Ultra 相似的架构设计,也就是将两个 Max 版芯片通过 UltraFusion 封装技术连接在一起,那么 M4 Ultra 的 GPU 性能应该会是 M4 Max 的 1.7 倍左右。
再结合 M4 Max 在 Geekbench 6 的 GPU 测试中得到的 197754 分,M4 Ultra 的 GPU 测试得分大概率会在 330000 左右,作为对比,目前消费级的最强显卡 RTX 4090 得分也只有 310000-320000。
图源:Max Tech
M4 Ultra 爆杀 RTX 4090?这个消息恐怕老黄看了都要做噩梦,不过也有人提出疑问:M4 Ultra 的 GPU 真的能有这么高的性能吗?在实际使用场景中真的能媲美 RTX 4090 吗?
M4 Ultra 虽然还未发布,但是我们可以从已经发布的 M4 Pro 和 M4 Max 上一窥这个系列芯片的性能表现。如果单看 Geekbench 6 的测试结果,你会发现 M4 Pro 的得分属实恐怖,在单核测试中以 3925 的成绩超越了 AMD 和英特尔的最新桌面端旗舰处理器,而在多核测试里,也明显领先 Ryzen 9 9950X,仅略输于酷睿 Ultra 9 285K。
至于性能定位更高的 M4 Max,则是在单核、多核测试中均碾压了 Ryzen 9 9950X 和酷睿 Ultra 9 285K,让整个 PC 市场感受到了苹果的强大。而且,在测试中 M4 系列芯片的核心主频及核心数都明显低于两个对手,只有 4.5GHz,但是却展现了更高的单核及多核性能。
可怕吗?很可怕。要知道酷睿 Ultra 9 285K 和 Ryzen 9 9950X 都是桌面端处理器,满载功耗均超过 200W,而 M4 Pro 和 M4 Max 却是 MacBook Pro 的移动端芯片,足见其能效比之高。
以目前 M4 Max 的性能推算,采用两颗 M4 Max 芯片组合而成的 M4 Ultra 在多核性能上或将达到 45000 分,是酷睿 Ultra 9 285K 的两倍。单核性能则一般不会有太大提升,不过仍然会高于 M4 Max,成为目前消费级市场的最强处理器。
再来看看 GPU 性能,曝光称其跑分会超过 RTX 4090,而依据则是 Geekbench 6 的 GPU 测试,这个测试涉及 GPU 的图像处理、计算摄像、机器学习、物理模拟和计算金融五个模块,并不单单测试游戏性能,这就给了 M4 Ultra 更多的得分空间。
所以,结合目前实测的 M4 Max GPU 性能数据,这个推测是有一定道理的,在极客湾的实测中,M4 Max 的 AI 大模型计算性能已经达到 RTX 4090 的 60%。甚至可以在 RTX 4090 因为爆显存而性能暴跌的情况下, 借助 128G 统一内存的优势继续流畅运行更大参数量的 AI 模型。
图源:极客湾
这也意味着,只要 M4 Ultra 的架构不发生根本性变化,至少在 AI 计算等方面的性能是可以超越 RTX 4090,成为消费级最强的 AI GPU。
那么游戏方面呢?从目前的实测结果来看,M4 Ultra 的游戏性能肯定无法与 RTX 4090 相比的,因为即使是运行原生 Mac 游戏《博德之门 3》,高分辨率下帧数也只是比 RTX 4070 移动版略高 30%,尚未达到 RTX 4080 移动版的水平。
而在 3DMark 的测试中,RTX 4090 桌面端的性能约为 RTX 4080 移动端的两倍,这也意味着 M4 Ultra 在最理想状态下,游戏性能也只能达到 RTX 4090 的 75% 左右。不过若是对比移动端的 RTX 4090,那么倒是有机会反超,毕竟移动端 RTX 4090 本质上就是 RTX 4080 桌面端,差距还是非常明显的。
另外,如果是非原生游戏,那么 GPU 的性能还会受到明显的削弱,实测中帧数直接从领先 RTX 4070 移动版 30% 变成落后 30% 甚至 50%,这时候别说挑战 RTX 4090 了,可以直接考虑和 RTX 4060 坐一桌。
对于想用 M4 Ultra 打游戏的朋友来说,个人建议是不如拿一万装台游戏电脑,体验会比 M4 Ultra 好很多。但是如果你的需求是用来跑本地 AI 大模型、视频剪辑、模型渲染等,那么 M4 Ultra 的表现或许会超过目前最强的消费级 PC 也说不定,对于英伟达和 AMD 的消费级 GPU 市场部门来说,这并不是一个好消息。
苹果的自研 M 系列芯片跑分屡创新高,着实让英特尔、AMD 等传统半导体厂商冷汗直冒,甚至不得不联手成立 x86 架构生态小组,共同探讨 x86 架构的未来,能让两个曾经的死对头联手,可想而知 Arm 带来的压力有多大。
实际上很多人也好奇,为什么 Arm 架构芯片的能效比可以如此惊人?其实关键就在于指令集上,Arm 的指令集相较于 x86 要精简很多。
你可以将 x86 看作是一台复杂的多功能卡车,它可以一次性处理大量的数据和任务,但是在面对简单任务时,复杂且庞大的指令集也让其难以降低自己的资源占用率。而 Arm 则是摩托车,虽然每次只能执行单个任务和少量数据,但是可以通过灵活的车辆调度,分配执行任务的最佳车辆数,让 Arm 芯片在运行时有着更好地能效。
基于 Arm 架构的特性,苹果等企业很快就意识到通过增加核心数(准备更多的摩托)和优化指令集(专车专用提升效率),就可以让 Arm 芯片在性能上取得突破,Arm 指令集的高能效比也让 Arm 芯片可以轻松堆砌大量核心,而不用过多的考虑功耗问题。
此外,Arm 架构的灵活性,让苹果可以根据需求定制化设计专门的模块负责对应的任务,使得芯片效率进一步提升,加上统一内存架构带来的低延迟特性,让 M 系列芯片的整体执行效率远程传统芯片。
图源:苹果
得益于多项优化,量变最终引起了质变,让 Arm 芯片成功在单核及多核性能上都超越了传统 x86 芯片,成为 PC 市场的新兴势力,而不再是固守在移动设备市场。而且,苹果很快就发现这个套路在 GPU 上也同样可行,通过堆砌核心数的方式让 GPU 性能同样进入爆发式增长。
以 M4 Pro 和 M4 Max 为例,前者的 GPU 核心数为 20 个,后者则是 40 个,而在实际测试中,后者的各项性能基本上就是前者的两倍。理论上,只要苹果愿意,在达到芯片内部延迟的上限之前可以无限堆叠核心,打造更强的 GPU。
不过苹果本身并非半导体企业,其芯片设计更多的是为产品服务,所以并不会像英伟达、AMD 那样为了销售芯片而设计出功耗、性能都「爆炸」的产品。但是苹果不这么做,不代表其他企业也这么想,比如高通就一直在关注 Arm GPU 和 CPU,除了消费端,服务器和数据中心同样是高通的目标市场。
在 2024 年,高通就宣布重回服务器芯片市场,推出基于 Nuvia 内核设计的服务器芯片,截止目前为止,相关机构预估服务器市场的 Arm 芯片占比已经达到 10%。其中不少 AI 算力中心都有增加 Arm GPU 算力服务器的计划,因为 Arm 的高能效可以显著降低 AI 推理时的电力成本,进而降低单位算力的成本。
正是因为 Arm 架构所带来的巨大威胁,前段时间英特尔与 AMD 签署合作协议时,英伟达也同样到场,并且同为生态小组的合作企业之一。目前,对于英伟达等企业来说,最好的消息是苹果无意参与到半导体芯片市场中,而坏消息则是,高通的 Nuvia 内核表现不错,恐怕会成为 GPU 市场的一匹黑马。
可以预见的是,在未来的 PC 市场中,Arm 必然会有一席之地,并且有望彻底挑战 x86 架构和英伟达的市场地位。
登录后才可以发布评论哦
打开小程序可以发布评论哦