雷锋网 11-26
应对AI训推驱动的存储三大变革,曙光牵头制定行业标准
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 进入 2025 年下半年,正以前所未有的速度催生存储需求。

据雷峰网了解,Q4 存储芯片价格已呈现全面上涨态势,行业普遍预测,存储需求将在 Q4 至明年 Q2 期间迎来大规模释放。

然而,当前产业链各环节的产能扩张进度难以匹配需求增长节奏,叠加存储介质成本持续飙升,于是,耐人寻味的分化景象出现了:

一边是客户内存条 " 一条难求 " 的困境;另一边,市场的报价体系陷入混乱——有二线存储厂商因为笃定价格将继续攀升,甚至暂停对外报价,临时安排员工休假,选择 " 囤货待涨 " 以赚取更大价差。

即便如此,在 AI 领域的存储采购决策中,内存效率仍被置于核心优先地位,成本因素则退居第二甚至第三位。就在行业多数参与者对涨价趋势 " 乐见其成 " 时,中科曙光站出来,想给这场 " 狂欢 " 降降温——

" 我们想呼吁整个产业更加理性,往更健康可控的方向去发展,这是我们做存储系统厂商的期望 ",曙光存储副总裁张新凤说道。

11 月 19 日,2025 数据存储产业大会在广州召开。在这场大会上,中科曙光迎来重要角色升级——正式出任中电标协数据存储专委会当值会长,宣布专委会将发起编写 AI 存储标准,并联合牵头成立 Future Storage 工作组,以推动中国存储产业在全球竞争中抢占先机。

站在存储周期 " 新一轮波峰 " 上,曙光作为中国智算产业的核心力量,对当前存储发展的趋势与挑战有怎样的判断?在 AI 推理带来的存储浪潮中,曙光的优势又是什么?

存储需求三大变化

在存储市场持续火热的情况下,有业内人士观察到,内存与闪存颗粒的产能已 " 吃满 " 到明年甚至后年。张新凤指出,在当前存储的涨价结构中,纯硬件成本超过 70% 来自存储介质,且涨幅普遍达到 50%-100%。

不过,这种产能的吃紧,与 AI 对更高性能存储的需求所带来的产能挤占,息息相关——

AI 对 I/O(存储设备与内存之间的数据交换)提出了远高于以往的要求,尤其是 GPU 的出现,对高带宽、大容量的 HBM(高带宽内存)需求更是大增。这类先进存储介质具有更高利润,进一步挤占传统存储介质的产能;加上目前全球具备量产能力的厂商数量有限,且多模态模型的发展让存储需求更趋多样复杂,种种趋势正给未来的存储供给造成压力。

可以说,存储介质本身像期货,具有明显的产业周期性;但 AI 的出现,改变了供应侧的周期节奏。

尽管如此,当前各类 AI 场景对存储的核心诉求仍然是 " 快 " ——既要高吞吐、低延时,也要系统稳定。

但在细分场景里,侧重点又有所不同:曙光存储副总裁郭照斌指出,训练阶段对带宽与吞吐要求较高;推理阶段则更看重低延时与高 IOPS。

那么,放眼客户侧,大家对 AI 时代的存储具体又提出什么新的需求?

张新凤发现,一方面,客户对性能要求的极速提升。过去,衡量高性能存储系统时的带宽单位是 GB/s,而如今已进入 TB/s 时代,性能差距达到 1000 倍。在这种极致的性能下,先进存储系统往往绕不开端到端 NVMe 全闪架构。

其次,是 " 融合能力 " 成为刚需。

在智算工作流中,从数据采集、打标签、清洗、训练,到 token 化、推理知识库构建,各个环节涉及 Swift API、NFS、S3 等多种协议。如今,越来越多客户希望一套存储系统可以解决所有问题,这使得融合能力成为核心竞争点。

除此之外,数据流动方式也出现根本变化。

此前,数据流动的方案是 " 一份数据在不同协议间多次拷贝 ",但这往往存在两个问题:一是时效性不足,二是空间利用率下降,后者直接关系到成本控制。

当下,现实的需求正在转变,客户更希望同一份数据可被不同协议直接访问。张新凤认为:" 这可能是所有行业真正要做智能化的起点。"

从 ParaStor 到标准制定:曙光定义 AI 存储新规则

存储主要分为分布式与集中式两类:分布式存储将数据分散存储在多个节点上,集中式存储则将所有数据集中存储于一个中心节点。

哪种会成为 AI 推理时代的主流?一种共识是:分布式存储更契合 AI 推理海量数据与高并发的核心需求。

曙光存储副总裁杨志雷也观察到,在 AI 场景中,一套系统需要同时支持多协议访问、冷热分层管理,分布式是最优解。

自 2004 年曙光启动 ParaStor 分布式存储研发以来,分布式存储产品便持续挤压集中式存储的市场份额,这一点从营收占比中已可见一斑。

其分布式 ParaStor 在兼具性能与低延时、高 IOPS 之外,也兼顾性能的线性扩展度——打破了 " 扩容与性能 " 的矛盾,让存储系统既能扩张容量的同时提升性能,且不牺牲低延时、高 IOPS 的核心优势。

杨志雷直言:分布式存储 " 未来投资回报比是最高的 "

不过,与此同时,曙光并没有放弃集中式存储:其在 2024 年 6 月便发布首款集中式存储产品 FlashNexus 全闪存阵列,正式切入这一领域。

" 集中式存储的增长并未放缓 ",杨志雷补充道,在金融、运营商、医疗等传统业务领域,集中式存储仍具备稳定性、可靠性优势;且在处理结构化数据的低延时需求上,集中式存储拥有天然优势——这些因素决定了,集中式存储短期内仍将与分布式存储并存。

事实上,经过多年积累,曙光在存储系统能力上进行了体系化重构,已经使存储从简单的数据容器升级为 " 智能的数据引擎 "。

举例来说,在具身智能领域,ParaStor 分布式全闪存储可提供超过 500GB/s 的聚合带宽,满足多模态数据的实时处理需求。

同时,其与智元机器人的合作也入选 "2025 年度数据存储典型实践案例 "。究其背后,在 AI 训练、推理以及具身智能机器人的领域之内,曙光提出两个核心性能的架构和理念:

一方面,在存储端采用超级隧道技术,结合无竞争化、无锁化等优化手段,充分发挥硬件的极致性能。

另一方面,推行近距离计算理念,或将存储与 CPU、GPU 深度融合——例如在 CPU、GPU 端增设存储接口,实现应用层面的深度结合。

并且,曙光存储将依托自身在 AI 存储领域的优势,聚焦 "AI 数据语义 " 核心,推动面向大模型训练的存储架构、接口协议与性能评测标准的制定。

在存储领域已深耕实践多年的曙光,如今已跻身存储标准制定的引领者行列,推动 AI 存储标准编写,构建存储技术标准和技术框架,旨在为各企业产品研发提供参考,打破传统产品孤岛问题。

市场信号已然明确:下一轮智算竞赛的核心决胜点,早已超越单纯的硬件颗粒争夺,转向谁能将海量数据转化为 " 智能燃料 " ——可持续流转、安全共享、高效复用的数据资源。

在这场数据价值重构的浪潮中,曙光致力成为推动产业升级的核心力量,为中国存储产业争取国际话语权。

雷峰网雷峰网

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 曙光 中科曙光 张新 期货
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论