三易生活 07-22
通义千问Qwen3模型升级,性能超越Kimi-K2
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

日前,阿里云通义千问方面宣布更新 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的新版本,并将其命名为 Qwen3-235B-A22B-Instruct-2507-FP8。目前,Qwen3 新模型已在魔搭社区和 HuggingFace 上开源更新。

据阿里云通义千问方面介绍,Qwen3 新模型通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。其中在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等多项测评中,Qwen3 新模型的表现出色,超过了 Kimi-K2、DeepSeek-V3 等旗舰开源模型,以及 Claude-Opus4-Non-thinking 等领先闭源模型。

此外,Qwen3 新模型还在多语言的长尾知识覆盖方面取得显著进步;在主观及开放性任务中显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本;长文本提升至 256K,上下文理解能力进一步增强。

值得一提的是,不久前阿里云通义千问旗下 AI 聊天产品 Qwen Chat 也迎来升级。在此次更新后,Qwen Chat 的可访问性和即时性进一步增强,交互方式也更加直观。目前用户访问通义官网首页,即可直接与 Qwen Chat 开聊。

同时 Qwen Chat 已支持多功能集成,包括 " 深入研究 "、" 图像生成 "、" 网页开发 "、" 深度思考 "、" 搜索 " 等。在 " 图片生成 " 模式下,用户可以通过文字描述生成高质量图片;而 " 网页开发 " 功能可以辅助前端工程师快速构建代码。此外,Qwen Chat 桌面端也已上线,并支持一键唤起 MCP。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

通义千问 阿里云 数学 编程 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论