海光DCU率先完成GLM-5.2 Day-0适配,长程任务国产底座就绪

近日 , 新一代旗舰开源大模型 GLM-5.2 发布 , 海光 DCU 产品已实现 Day 0 极速适配。国内开发者无需经历漫长的等待与代码重构 , 即可在搭载海光 DCU 的国产算力平台上体验其完整性能与满血实力。

GLM-5.2 是智谱面向 Coding 与长程任务打造的旗舰开源模型 , 代码能力位居开源模型之首。在全球百万开发者参与的 Code Arena 前端盲测中 ,GLM-5.2 位列全球可用模型第一。在 Terminal-Bench 2.1 ( AI Agent 命令行操作评测 ) 中 ,GLM-5.2 比 Claude Opus 4.8 低 4%, 较前代 GLM-5.1 提升 17.5%; 在 MCP-Atlas ( 工具使用评测 ) 上距 Opus 4.8 仅 0.8% 差距。综合 Coding 实力大致位于 Opus 4.7 至 4.8 区间 , 主流编程基准保持开源 SOTA。

本次适配的核心亮点在于对 Solid 1M ( 100 万 ) 无损上下文的完美支持。过去 , 受限于算力带宽与显存管理效率 , 长上下文往往在实际应用中出现性能劣化。而海光 DCU 凭借其高带宽内存访问能力和针对长序列推理的优化指令集 , 成功支撑了 GLM-5.2 模型在 1M 上下文窗口下的稳定表现 , 为 " 长程任务 " 提供了坚实的物理基础 , 这种能力让 AI 从 " 辅助对话 " 进化为 " 自主执行 ", 极大地释放了开发者的生产力。

海光 DCU 针对 GLM-5.2 的双核心场景进行了深度优化。长上下文推理方面 , 通过内存调度机制优化与 IndexShare 技术 ( 在每四层稀疏注意力层之间复用索引器 ) ,1M 上下文下单位 Token 的 FLOPs 消耗显著降低 , 确保超大规模序列处理的稳定性与效率。代码生成方面 , 对关键算子专项调优 , 保障复杂系统工程中的推理性能。

在实际长程任务中 , 海光 DCU 为 GLM-5.2 提供了持续稳定的算力底座。模型可在平台上连续完成覆盖 Web、移动端与小程序的多端应用开发 , 累计处理 88 万以上的 tokens。此外 , 凭借 IndexShare 架构与海光 DCU 硬件特性的深度契合 , 双方共同实现了在有限算力资源下处理超大规模任务的可能。这不仅意味着国内开发者无需等待即可在国产平台上体验到媲美国际顶尖水平的模型性能 , 更意味着核心数据与关键业务逻辑可以在完全自主可控的算力底座上安全运行。

海光信息与智谱正持续推进 GLM-5.2 的深层优化 , 进一步释放硬件潜力。双方后续将围绕长程任务与代码能力展开更多场景化验证 , 推动模型在真实软件开发与系统优化中的规模化落地。

宙世代

一起剪

相关标签