快科技 1 月 13 日消息,花旗银行在最新报告中指出,随着 NVIDIA 采用推论情境记忆存储(Inference Context Memory Storage,ICMS)等新技术,全球 NAND 供应短缺的状况将进一步恶化。
在 AI 推理过程中,为了避免重复计算、提升响应速度,系统会使用 KV 缓存机制,类似于 AI 模型的 " 短期记忆 ",但随着上下文长度的爆炸式增长,昂贵的 HBM 早已不堪重负。
为了解决这一瓶颈,NVIDIA 在宣布推出由 BlueField-4 DPU 驱动的 ICMS 平台,该平台建立了一个名为 G3.5 的全新存储层级:将原本挤在 HBM 中的 KV 缓存放到可扩展性更强的本地 SSD 中。

得益于此,NVIDIA 能够明显提升推理速度,最高可达 5 倍,同时能源效率提升高达 5 倍,延迟也大幅降低。
花旗预计,为了支持 ICMS 运作,在一套 Vera Rubin NVL72 AI 配置中,NVIDIA 将为每个机架配置最多 16TB 的额外存储,总体 SSD 容量达到约 1152TB。
根据市场预测,Vera Rubin 服务器在 2026 年的出货量预计为 3 万台,2027 年将达到 10 万台。
这意味着 2026 年由此产生的额外 NAND 需求将达到 3456 万 TB,占全球总需求 2.8%,到 2027 年需求将飙升至 1.15 亿 TB,占全球 NAND 总需求的 9.3%。
而且花旗的分析仅基于 Vera Rubin 平台,并未考虑更高规格的 Rubin Ultra 系统,也未纳入后续 Feynman 架构可能带来的新增需求,这意味着实际 NAND 需求增长可能比目前预测的更为显著。
花旗认为,NVIDIA 采用 ICMS 技术,将成为 NAND 供应商的积极催化剂,三星、SK 海力士、铠侠、西部数据及美光将成为最大受益者。



登录后才可以发布评论哦
打开小程序可以发布评论哦