在此前的 CES 2026 展会中,英伟达发布了下一代的 AI 超级计算平台,Vera Rubin 系统。在目前的环境体系中,此类 LLM 智能体需要依赖大量的长期记忆,并存储下跨越多轮的对话,以及会话内容的上下文,以便 AI 能够基于此前已经生成的推理内容进行继承构建,而非从头再来。这些内容也被称之为 KV 缓存,按照传统的做法这些缓存会被存储在 GPU 的 HBM 缓存中,但很显然以 Vera Rubin 那恐怖的算力来说,AI 集群的数据需求增长,HBM 已经无法承受。

因此,英伟达推出了全新的 Bluefield-4 DPU 来成为 Vera Rubin 平台中新的推理上下文记忆存储平台(ICMS),从而提供更为高效的 KV 缓存复用。虽然这对于处理能力有着明显的提升,但是大概率会对 NAND 产能引发新一波的短缺问题。

根据花旗的分析,一台 Vera Rubin 系统,每颗 GPU 就大约需要配备 16TB 的 NAND 容量,这意味着单单一套 Vera Rubin NVL72 配置就需要消耗掉 1152TB。而根据推算,Vera Rubin 的出货量在 2027 年可能达到 10 万台,如果按照这个数量级来看的话,那就需要占到未来几年全球 NAND 总需求的 9.3%。这样算来,英伟达凭借一己之力就可以造成供应链冲击,但似乎 NAND 行业目前还没有考虑好在现阶段用哪些措施去应对如此庞大的增长需求。

无论是从 DRAM 还是 NAND 来看,一台 AI 系统所消耗的 DRAM 就差不多相当于 100 台普通家用 PC,NAND 也差不多相当于 3 台普通 PC。对于存储生产厂商而言,自然是优先保障能获得大量订单且高利润的企业级用户需求,剩下的边角料才会来提供给本就处于优先级末尾的消费级 PCDIY 市场。这对于电脑玩家来说无疑是个非常不利的困境,前有堪比金条的内存,现在还得搭上固态 SSD 来作伴,更加雪上加霜。所以如果近期有着购买 SSD 的意向的话,建议还是从现在起就早早囤货吧。


登录后才可以发布评论哦
打开小程序可以发布评论哦