快科技 4 月 30 日消息,日前,阿里巴巴发布并开源新一代通义千问模型 Qwen3,参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能则全面超越 DeepSeek-R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。
Qwen3 发布当天,摩尔线程宣布,其率先完成了 Qwen3 全系列模型在全功能 GPU 上的高效支持。
摩尔线程表示,这一成果充分验证了 MUSA 架构和全功能 GPU 的技术成熟度与可靠性。
目前,主流推理引擎均可基于摩尔线程 MUSA 平台运行 Qwen3 系列模型。
摩尔线程称,MUSA 平台能够作为 vLLM、Ollama、GPU Stack 等各类主流开源推理引擎的后端,为 Qwen3 系列模型的高效运行提供强大动力。
例如,QWen3-235B-A22B(Qwen3 系列最大参数量模型),基于 vLLM-MUSA 引擎在摩尔线程全功能 GPU 上稳定运行。
据了解,此次开源的两款 MoE 模型是 Qwen3-235B-A22B 和 Qwen3-30B-A3B;同时还包括六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。
登录后才可以发布评论哦
打开小程序可以发布评论哦