阿里发布新一代基模千问3.5，每百万Token低至0.8元

《科创板日报》2 月 16 日讯（记者黄心怡）除夕当天，阿里巴巴开源全新一代大模型千问 Qwen3.5-Plus，总参数为 3970 亿，激活仅 170 亿，性能超过万亿参数的 Qwen3-Max 模型，部署显存占用降低 60%，最大推理吞吐量可提升至 19 倍。Qwen3.5-Plus 的 API 价格每百万 Token 低至 0.8 元，为 Gemini 3 Pro 的 1/18。

与前几代的千问大语言模型不同，千问 3.5 从纯文本模型升级为多模态模型。千问 3 预训练在纯文本 Tokens 上进行，而千问 3.5 基于视觉和文本混合 token 上预训练，并新增中英文、多语言、STEM 和推理等数据，以不到 40% 的参数量获得超万亿的 Qwen3-Max 基座模型的性能。

千问 3.5 在 MMLU-Pro 知识推理评测中得分 87.8 分，超越 GPT-5.2；在博士级难题 GPQA 测评中斩获 88.4 分，高于 Claude 4.5；在指令遵循 IFBench 以 76.5 分刷新所有模型纪录；而在通用 Agent 评测 BFCL-V4、搜索 Agent 评测 Browsecomp 等基准中，千问 3.5 表现均超越 Gemini 3 Pro、GPT-5.2。

在视频理解方面，千问 3.5 支持 2 小时（1M token 上下文）的视频直接输入，适用于长视频内容分析与摘要生成。同时，千问 3.5 实现了视觉理解与代码能力的融合，结合图搜和生图工具，可将手绘界面草图直接转为可用的前端代码。

值得注意的是，在 Agent 应用方面，千问 3.5 可自主操作手机与电脑，在移动端支持更多主流 APP 与指令，在 PC 端可处理多步骤操作，如跨应用数据整理、自动化流程执行等。同时，千问团队构建了一个可扩展的 Agent 异步强化学习框架，端到端可加速 3 到 5 倍，并将插件式智能体 Agent 支持扩展至百万级规模。

据悉，千问 APP、PC 端已第一时间接入 Qwen3.5-Plus 模型。阿里很快将继续开源不同尺寸、不同功能的千问 3.5 系列模型。而性能更强的旗舰模型 Qwen3.5-Max 不久也将发布。

今年春节期间，国产大模型领域迎来密集发布潮。字节跳动的视频生成模型 Seedance 2.0、智谱 AI 旗舰模型 GLM-5、蚂蚁集团的全模态大模型 Ming-Flash-Omni 2.0、MiniMax 一代文本模型 M2.5 等相继发布。此外，DeepSeek，网页 /APP 正在测试新的长文本模型结构，支持 1M（百万 Token）上下文。

IDC 中国研究经理孙振亚认为，大模型的能力正在从纯粹的生成式输出向智能体能力进化。各家模型厂商都在代码、多模态、长上下文和工具调用能力上做针对性的优化。" 智能体落地毫无疑问是这一轮竞争的重点，甚至可以说是最核心的主线。" 孙振亚称。

宙世代

一起剪

相关标签