英伟达 Blackwell 图形处理器在部署到设计可容纳 72 个芯片的服务器机架上时,出现了过热问题,引发行业广泛关注。这款旨在推动 AI 计算革命的高端芯片,在集成度与能效比方面表现出色,但在实际应用中遭遇了散热挑战。据知情人士透露,英伟达已紧急要求供应商调整机架设计,以缓解过热现象。
Blackwell 芯片采用台积电 4 纳米工艺制造,拥有 2080 亿个晶体管,单芯片 AI 性能高达 20 PetaFLOPS,是英伟达在 AI 和高性能计算领域的重要突破。然而,在高负荷运算下,其产生的热量超出了现有散热系统的处理能力,导致服务器机架出现过热。
英伟达正积极与云服务提供商合作,共同优化散热方案,以确保 Blackwell 芯片的稳定运行。尽管这一挑战对英伟达的供货计划造成了一定影响,但公司表示,工程迭代是技术发展过程中不可避免的一部分,他们将继续努力解决这一问题,以满足客户对高性能计算的需求。此次事件也凸显了在高密度部署高功率芯片时,散热技术的重要性。
登录后才可以发布评论哦
打开小程序可以发布评论哦