驱动之家 02-11
国产AI大模型杀疯了:不止DS 智谱GLM-5、Minimax 2.5双双发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 2 月 11 日消息,大家都知道这个春节档国产 AI 大模型会集中发布,然而没想到的是在 DeepSeek 发布新模型之后,其他两个重磅产品—— GLM-5、Minimax 2.5 也突然上线了。

我们之前就介绍过,本次 AI 春节档的重磅选手除了 DeepSeek V4 之外,阿里千问的 Qwen3.5、智谱的 GLM-5、Minimax 2.5 都是重量级选手,而之前已经有的就是字节的 SeeDance 2.0 这几天已经杀疯了。

目前 GLM-5 已经在 z.ai 官网上线,介绍是最新旗舰对话、编程与智能体模型,此前消息显示它采用了与 DeepSeek-V3/V3.2 相同的技术路线—— DeepSeek 稀疏注意力,简称 DSA,总参数量达 745B,是上一代 GLM-4.7 的 2 倍。

除了 DSA 之外,GLM-5 另一大技术特色是多 Token 预测(Multi-Token Prediction,MTP),有 78 层隐藏层,256 个专家,每次激活 8 个,激活参数约 44B,稀疏度 5.9%,上下文窗口最高支持 202K token。

Minimax 官网上也上线了 Minimax 2.5,考虑到他们一个多月前才发布了 Minimax 2.2,这次的更新速度也是爆表了。

截至发稿时,Minimax 2.5 与 GLM-5 的具体更新内容还没公布,但这两个 AI 大模型都会重点提升编程与智能体能力,对标海外御三家的表现,具体性能还要等广大网友及专业人员的测试,后续会持续关注与更新进展。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 阿里 春节档 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论