2026 年 3 月 30 日到 4 月 2 日,阿里巴巴旗下的通义实验室密集发布了三个模型:
先是 3 月 30 日的 Qwen3.5-Omni,主打全模态交互。它在 215 项音视频理解、识别、交互任务中取得最佳成绩,多项测试超过 Gemini-3.1 Pro。支持图片、视频、语音、文字的输入与输出。其中,一个意外涌现的能力是 " 音视频 Vibe Coding":对着摄像头口述需求,模型可直接生成带 UI 的产品原型代码。这算是 AI 编程的一个新境界。
然后是 4 月 1 日的 Wan2.7-Image,主打图像生成与编辑。它在人类偏好盲测中文生图能力排名国内第一,接近了 Nano Banana Pro 的水准。在告别 "AI 标准脸 " 上也有突破,可以支持脸型和眼型等细节定制,也能精准指定颜色配比;在多图多主体一致性上也大有进益。
最后是 4 月 2 日祭出的重磅作品 Qwen3.6-Plus,主打编程与 Agent。它在 SWE-bench 等多项编程评测中超过参数量 2 到 3 倍于它的 GLM-5 和 Kimi-K2.5,是目前编程得分最高的国产模型,接近 Claude 系列水平。
编程能力的提升,让 Qwen3.6-Plus 更适合 " 代理式编程 "(Agentic Coding)。在实测中,Qwen3.6-Plus 可自主拆解任务、规划路径、写代码、测试修改,直至完成交付,在前端开发和仓库级复杂任务中都能跑通。基于多模态训练,Qwen3.6-Plus 能看懂设计稿,进而生成前端代码。它支持 100 万 token 上下文,适配了 Claude Code 和 Cline 等主流 Agent 框架。而旗舰版 Qwen3.6-Max 也将在近期发布。
这是通义实验室在林俊旸、郁博文和惠彬原等骨干研究人员在 3 月初离职之后的第一次密集的模型发布,有着特定的信号意义,也意味着一次真正的变阵。
Model as an Agent
它首先试图证明阿里巴巴和通义实验室的模型研究能力是持续、可演进的,短期的人事震荡没有伤筋动骨,也反向促成了以 token 消费为出发点的架构调整。
尤其是 Wan2.7-image ——作为千问大模型旗下的图像生成模型 Wan,此前在 AI 生态的舆论场的抛头露面不像 Qwen 系列那么高频,但 Wan 系列带来的 token 消耗和实际 API 收入比 Qwen 系列更高,是一个很长时间以来被人们忽略的事实。
通义实验室旗下的模型布局是多点的,Wan 不可或缺,这次 Wan2.7-image 与 Qwen3.6-Plus 和 Qwen3.5-Omni 几乎同一时间对外亮相,也赋予了它应有的地位权重。
而这轮模型发布透露的更重要的信号是:Agent 成为了阿里巴巴新模型的战略重心。
Qwen3.6-Plus 主打 Agentic Coding,即代理式编程;Qwen3.5-Omni 涌现出音视频交互的 Vibe Coding;生图模型 Wan2.7 也强调可被 Agent 通过 skills 调用能力,它们指向的是同一件事:自主完成任务的能力,是衡量模型价值更重要的参照系。
Model as an Agent。
这个信号的释放,与阿里巴巴在 3 月中旬成立 ATH 事业群 (Alibaba Token Hub)之后的一系列战略调整与明晰,形成了紧密的强关联。
一个无可争议的共识是:AI 模型的发展已进入了推理引擎的阶段。
而推理引擎 " 外化 " 的最直观的产品形态,即是 Agent。对全球所有的基座模型玩家而言," 通用 Agent" 已经是它们必须 " 内化 " 的关键能力。
它可以是基于模型和工程化强大能力的自动化编程,也可以是 Computer Use 和 Phone Use,可以用 CLI 的界面呈现给专业开发者,也可以保留 GUI 界面给普通的生产力创造型用户,但它们本质上都是模型自带的通用 Agent,是专业用户和普通用户消费 token 的 hub。
你甚至可以认为,token hub 就是 Agent。而 ATH,就是阿里巴巴 Agent,更准确点说,是阿里巴巴 Agent 能力的集合。
It's all about Token
顺着这个思路,你就更容易发现千问大模型系列的这次密集发布,与此前的模型亮相背后有着哪些根本的不同。
首先,它前所未有地强调场景导向。
此前千问系列的模型,往往强调 " 综合能力 " 的秀肌肉感—— MMLU、C-Eval、GSM8K 等等,都跑一遍,追求一个模型在所有维度的性能指标,都好看。
但这次的变化是:Qwen 3.6-plus 主打以编程为核心的 Agent 能力;Wan2.7-image 主打图像生成与编辑的 Agent 可调用能力;Qwen 3.5-omni 主打多模态交互的 vibe coding Agent 能力。面向不同场景,又都是 Agent 能力驱动。它不再追求在一个通用模型上,什么都能干,大多数 benchmark 都优秀,而转向在具体场景上,用不同的 Model as an Agent,完整地执行不同的任务。阿里巴巴的千问大模型系列,开始用实战表现而非综合指标的排名,来定义模型的能力。
而实战表现,最终指向的是 token 的消耗,从长期看,也就是收入的增长。
其次,它开始把千问模型定义为 Agent 的基础设施。
一直以来,千问大模型,准确地说是 Qwen,在普通用户和专业开发者的视角中,是两个完全不同的东西。普通用户觉得它是个免费的 chatbot,专业开发者觉得它是可以被灵活下载部署的开源模型,基于它衍生自己的模型,或开发自己的垂直 Agent。前者主要来自国内,后者更多聚集在硅谷。但与 ChatGPT 和 Claude 不遗余力的 Agent 化演进不同,Qwen 一直也没被广泛地认为具有强烈的 Agent 属性。现在事情起了变化。
Qwen3.6-Plus 基于其被证明的 Agentic Coding 能力,已被明确设计为 Agent 系统的推理引擎,而不是面向终端用户的聊天工具。它与 OpenClaw 和 Claude Code 等系统集成,充当推理层,这些工具负责执行和交互,模型更像是一个核心引擎,而非一个模型成品。这也解释了它具有 100 万 token 上下文窗口的意义:聊天场景下,用户一次消耗几百到几千 token,但 Agent 跑一个任务可能消耗几十万甚至上百万 token,100 万 token 的上下文可不是技术炫耀,而是 Agent 场景的刚需。
这应该是千问第一次真正地有了自己的 Agent 推理引擎,实现了 Model As an Agent。在几乎所有基座模型公司都意识到 Agent 才是调动 token 消费的第一生产力之后,千问也终于补上了这一环。
更重要的,是它第一时间接入了阿里巴巴的整个业务体系——更准确点说,是阿里巴巴的生产力业务体系。
过去,千问大模型的发布,就是发布模型本身,是通义实验室自己的事。它面向的 " 客户 ",是全球的 AI 开发者,主阵地是 Hugging Face、GitHub 和 Reddit。阿里巴巴旗下的各个业务单元并未受到直接的影响,甚至不同的业务单元还有自己的模型。
但这次三个模型发布的同时,阿里内部的 AI 应用体系第一时间全面接入:由钉钉脱胎而生的 AI 原生企业工作平台 " 悟空 "、千问 APP 和编程工具 Qoder 都在同一星期接入了上述三个模型。通义实验室的 " 客户 ",从全球几乎是免费使用的开发者,变成了阿里巴巴内部有 token 消费需求的生产力业务部门。至于内部怎么结算,那是另外一件事。
这背后的推手当然是 ATH 事业群。它把算力层、模型层、应用层并到一起,形成了 " 创造 token(千问模型)、 输送 token(阿里云算力)和 消费 token(悟空、千问 APP 等 AI 原生应用)" 的链路。千问大模型不再是一个孤立的业务单元,而是阿里 AI 业务体系的供给侧基础设施。至少,在模型和 Agent 能力第一时间接入内部相关业务单元这一点上,阿里巴巴的做法已经跟 Google 没什么两样了。
这三点变化,配合三款 " 千问系 " 模型的发布,一个底层逻辑正在浮现,那就是 " 大家都来用千问大模型 " 已经不够了,现在需要的是:" 大家都来用千问大模型,直接调用模型在不同场景下的 Agent 能力,直接完成工作,在千问上消费 token,给千问,包括阿里云甚至整个阿里巴巴,贡献收入 "。
模型是基石,Agent 是入口,模型与 Agent 驱动的 token 消耗,是增长引擎。
这个增长引擎转得起来么?
在千问 " 三连发 " 之后的第二天,即 2026 年 4 月 3 日,Qwen 3.6-plus 在全球最重要的模型调用平台 OpenRouter 上的调用量排名已位居第二。目前的第一名是小米的 MiMo-V2-Pro,一直靠免费占据头筹。而 Qwen 3.6-plus 这次是收费的,每百万 token 2 元,尽管比 Claude API 便宜得多,但它考验的是模型性能、Agent 引擎能力和综合性价比的整体,全球的开发者和 AI 专业用户都在这里用脚投票。
要知道,这恐怕是千问系列模型第一次在 OpenRouter 调用量榜单上排到前 10 的位置。千问不再只靠免费部署的开源小尺寸模型通吃开发者市场了,这是最重要的变化。与此同时,阿里云 AI 算力和存储产品最高涨价 34%,市场反应目前呈现供不应求。上下游互相拉动,正在形成商业闭环。
过去的一个月,通义实验室、千问大模型乃至整个阿里巴巴的 AI 战略被前所未有地放在聚光灯下审视:一些问题被暴露了,一些遗憾被留下了,一些动作被放大了。
但真正值得被关心的只有两个问题:其一,千问还能不能持续地发布 " 能打 " 的模型;其二,千问能给正在爆发的 全球 token 消费市场带来什么,能给阿里巴巴带来什么。
现在来看,两个问题都找到了答案。


登录后才可以发布评论哦
打开小程序可以发布评论哦