智东西 20小时前
英伟达推出Spectrum-XGS以太网,把多个数据中心组合成十亿瓦级AI超级工厂
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | ZeR0

编辑 | 漠影

智东西 8 月 23 日报道,NVIDIA 昨夜推出一项重要网络创新技术—— NVIDIA Spectrum-XGS 以太网。这项跨区域扩展(scale-across)技术可将多个分布式数据中心组合成一个十亿瓦级 AI 超级工厂。

NVIDIA Spectrum-X 以太网提供横向扩展架构,可连接整个集群,快速将海量数据集传输到 AI 模型中,并协调整个数据中心的 GPU 间通信。Spectrum-XGS 以太网是 NVIDIA Spectrum-X 以太网平台的一部分,现可供货。

年度芯片及系统架构顶级会议 Hot Chips 举行在即,AI 推理和网络将成为关注焦点。NVIDIA 将在 Hot Chips 期间重点介绍 NVIDIA Spectrum-XGS 以太网,并详细分享 NVIDIA 网络、数据中心机架、神经渲染技术、NVIDIA GB10 超级芯片与 DGX Spark、集成硅光子学的共封装光学器件(CPO)交换机等推理和加速计算领域的最新技术进展。

随着 AI 需求的激增,单个设施内的数据中心功率和容量已达到极限。要实现数据中心扩展,必须打破建筑物的限制,而现有的商用以太网网络基础设施因高延迟、高抖动及性能的不可预测而无法满足需求。

对此,NVIDIA Spectrum-X 以太网平台新增 Spectrum-XGS 以太网,通过引入跨区域扩展(scale-across)基础设施打破了上述限制。

NVIDIA 创始人兼 CEO 黄仁勋谈道:"AI 工业革命已经到来,而巨型 AI 工厂是这场变革的核心基础设施。继纵向扩展(scale-up)和横向扩展(scale-out)技术后,我们又通过推出 NVIDIA Spectrum-XGS 以太网提供跨区域扩展(scale-across)技术,将不同城市、国家乃至大洲的数据中心组合成庞大的十亿瓦级的 AI 超级工厂。"

跨区域扩展(scale-across)是继纵向扩展(scale-up)和横向扩展(scale-out)之后的 AI 计算 " 第三大支柱 "。Spectrum-XGS 以太网完全集成于 Spectrum-X 平台,通过算法实现了网络和数据中心设施间距离动态适配。

凭借先进的、自动调节的远距离拥塞控制、精准延迟管理及端到端遥测技术,Spectrum-XGS 以太网将 NVIDIA 集合通信库性能提升了近 1 倍,加速了多 GPU 和多节点的通信性能,实现了可预测异地 AI 集群的性能。这样就可以将多个数据中心组合成一个统一的 AI 超级工厂运行,全面优化长距离连接性能。

CoreWeave 等超大规模云提供商已开始部署这种新基础设施。其中 CoreWeave 将成为首批使用 Spectrum-XGS 以太网连接它的数据中心的企业。

Spectrum-X 以太网网络平台为多租户、超大规模 AI 工厂(包括全球最大的 AI 超级计算机)提供的带宽密度较传统以太网高出 1.6 倍。该平台由 NVIDIA Spectrum-X 交换机和 NVIDIA ConnectX-8 SuperNIC 组成,帮助构建未来 AI 平台的企业实现无缝扩展、超低延迟和空前性能。

今日最新发布是 NVIDIA 一系列网络创新技术发布的延续,如 NVIDIA Spectrum-X 和 NVIDIA Quantum-X CPO 网络交换机等,这些技术一起能够将位于不同地点的数百万颗 GPU 组合成 AI 工厂,突破大规模 AI 基础设施性能和效率的极限,同时降低能耗和运营成本。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 数据中心 nvidia 以太网 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论