NVIDIA Blackwell GPU首次实测跑分：提升多达2.2倍

快科技 11 月 14 日消息，NVIDIA Blackwell GPU 相当强悍，大家都知道，但到底有多强呢？

除了官方宣传数据，现在终于第一次看到了实测数据，来自 MLCommons MLPerf v4.1，考察 AI 训练推理性能的最佳平台。

对比对象是两代服务器 HGX B200、HGX H200，前者包含多达八颗 Blackwell GPU B200，单颗功耗高达 1000W。

GPT-3 预训练项目中，Blackwell 的性能相比上代 Hopper 翻了一番。

Llama 2 700 亿参数微调项目中，Blackwell 的性能更是提升了多达 2.2 倍。

值得一提的是，Blackwell 平台具备 ConnectX-7 SuperNICs 网卡、Quantum-2 InfiniBand 交换机，再加上第五代 NVLink 互连总线，可以充分保障节点间的通信，可以平衡分配 AI 训练负载，整体效率更高。

比如同样的 GPT-3 1750 亿参数性能，Hopper 需要多达 256 颗 GPU，Blackwell 就只需要 64 颗。

宙世代