驱动之家 02-10
股价已涨200% 海外神秘大模型几乎确定为GLM-5:复用DS架构
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 2 月 10 日消息,前几天我们提到春节期间国产 AI 行业会有几款重磅产品推出,除了最受关注的 DeepSeek V4 之外,智谱的新一代大模型 GLM-5 也要上线了,推动该公司股价近期大涨 200%。

前几天在全球模型服务平台 OpenRouter 上线了一款代号为 "Pony Alpha" 的匿名模型,引起了全球关注,因为它的表现很不错,尤其是在写代码方面被认为能达到 Claude Opus 一个级别。

Pony Alpha 到底是哪家的模型一度引发网友热烈讨论,目前几乎可以确定是智谱的 GLM-5 了,一方面是系统的提示词显示它说自己是 GLM,另一方面网友验证了一个 GLM 大模型家族的特色 bug,那就是输入   " 锅内倒入植物油烧热 "   得到的答案是乱七八糟的,Pony Alpha 也符合这个特点。

随着更多信息的挖掘出来,GLM-5 的技术架构也差不多明确了,它采用了与 DeepSeek-V3/V3.2 相同的技术路线—— DeepSeek 稀疏注意力,简称 DSA,总参数量达 745B,是上一代 GLM-4.7 的 2 倍。

除了 DSA 之外,GLM-5 另一大技术特色是多 Token 预测(Multi-Token Prediction,MTP),有 78 层隐藏层,256 个专家,每次激活 8 个,激活参数约 44B,稀疏度 5.9%,上下文窗口最高支持 202K token。

复用 DS 架构的好处有很多,可以直接受益于 vLLM、SGLang 等主流推理框架的现有优化,部署门槛将大幅降低。

不过值得关注的是 GLM-5 的多模态能力,因为 DS 此前还是文本大模型,不支持视频的,而多模态能力在 2026 年是新一代大模型不应该缺少的能力。

随着 GLM 大模型在海内外受到欢迎,智谱公司股价近期也一路上涨,总市值已经到了 1500 亿港币左右,是数月前 IPO 上市时的 3 倍。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

春节 ai ipo
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论