驱动之家 04-29
阿里Qwen3发布后 马斯克立刻官宣:下周推出Grok 3.5
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 29 日消息,马斯克刚刚在社交平台 X 上称,下周将向 SuperGrok 订阅者推出 Grok 3.5,并将该条信息顶置。

据马斯克称,Grok 3.5 是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。同时,Grok 可以从第一原理推理并得出互联网上根本不存在的答案。

Grok 3.5 被马斯克旗下的 xAI 宣传为 " 全球首个人工智能能从第一性原理推理,生成网络上不存在的答案 "。

而今年 2 月 18 日,xAI 正式发布 Grok 3,并在两天后把 Grok 3 免费向所有公众开放,超越 ChatGPT, 登顶苹果应用商店免费应用下载排行榜第一名。

马斯克曾称 Grok 3 为 " 地球上最聪明的人工智能 "。

令人值得关注的是,马斯克 " 官宣下周推出 Grok 3.5" 的这一举动恰巧发生在阿里巴巴发布 Qwen3(千问 3)之后。

4 月 29 日凌晨 4 点,阿里巴巴开源新一代通义千问模型 Qwen3,参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。

据悉,Qwen3 是国内首个 " 混合推理模型 "," 快思考 " 与 " 慢思考 " 集成进同一个模型,对简单需求可低算力 " 秒回 " 答案,对复杂问题可多步骤 " 深度思考 ",大大节省算力消耗。

作为 Qwen 系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。

在奥数水平的 AIME25 测评中,Qwen3 斩获 81.5 分,刷新开源纪录。

在考察代码能力的 LiveCodeBench 评测中,Qwen3 突破 70 分大关,表现甚至超过 Grok3。

在评估模型人类偏好对齐的 ArenaHard 测评中,Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。

性能大幅提升的同时,Qwen3 的部署成本还大幅下降,仅需 4 张 H20 即可部署 Qwen3 满血版,显存占用仅为性能相近模型的三分之一。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

马斯克 人工智能 阿里巴巴 开源 奥数
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论