千问是什么？答案正在风中飘荡

2026 年 3 月 30 日到 4 月 2 日，阿里巴巴旗下的通义实验室密集发布了三个模型：

先是 3 月 30 日的 Qwen3.5-Omni，主打全模态交互。它在 215 项音视频理解、识别、交互任务中取得最佳成绩，多项测试超过 Gemini-3.1 Pro。支持图片、视频、语音、文字的输入与输出。其中，一个意外涌现的能力是 " 音视频 Vibe Coding"：对着摄像头口述需求，模型可直接生成带 UI 的产品原型代码。这算是 AI 编程的一个新境界。

然后是 4 月 1 日的 Wan2.7-Image，主打图像生成与编辑。它在人类偏好盲测中文生图能力排名国内第一，接近了 Nano Banana Pro 的水准。在告别 "AI 标准脸 " 上也有突破，可以支持脸型和眼型等细节定制，也能精准指定颜色配比；在多图多主体一致性上也大有进益。

最后是 4 月 2 日祭出的重磅作品 Qwen3.6-Plus，主打编程与 Agent。它在 SWE-bench 等多项编程评测中超过参数量 2 到 3 倍于它的 GLM-5 和 Kimi-K2.5，是目前编程得分最高的国产模型，接近 Claude 系列水平。

编程能力的提升，让 Qwen3.6-Plus 更适合 " 代理式编程 "（Agentic Coding）。在实测中，Qwen3.6-Plus 可自主拆解任务、规划路径、写代码、测试修改，直至完成交付，在前端开发和仓库级复杂任务中都能跑通。基于多模态训练，Qwen3.6-Plus 能看懂设计稿，进而生成前端代码。它支持 100 万 token 上下文，适配了 Claude Code 和 Cline 等主流 Agent 框架。而旗舰版 Qwen3.6-Max 也将在近期发布。

这是通义实验室在林俊旸、郁博文和惠彬原等骨干研究人员在 3 月初离职之后的第一次密集的模型发布，有着特定的信号意义，也意味着一次真正的变阵。

Model as an Agent

它首先试图证明阿里巴巴和通义实验室的模型研究能力是持续、可演进的，短期的人事震荡没有伤筋动骨，也反向促成了以 token 消费为出发点的架构调整。

尤其是 Wan2.7-image ——作为千问大模型旗下的图像生成模型 Wan，此前在 AI 生态的舆论场的抛头露面不像 Qwen 系列那么高频，但 Wan 系列带来的 token 消耗和实际 API 收入比 Qwen 系列更高，是一个很长时间以来被人们忽略的事实。

通义实验室旗下的模型布局是多点的，Wan 不可或缺，这次 Wan2.7-image 与 Qwen3.6-Plus 和 Qwen3.5-Omni 几乎同一时间对外亮相，也赋予了它应有的地位权重。

而这轮模型发布透露的更重要的信号是：Agent 成为了阿里巴巴新模型的战略重心。

Qwen3.6-Plus 主打 Agentic Coding，即代理式编程；Qwen3.5-Omni 涌现出音视频交互的 Vibe Coding；生图模型 Wan2.7 也强调可被 Agent 通过 skills 调用能力，它们指向的是同一件事：自主完成任务的能力，是衡量模型价值更重要的参照系。

Model as an Agent。

这个信号的释放，与阿里巴巴在 3 月中旬成立 ATH 事业群（Alibaba Token Hub）之后的一系列战略调整与明晰，形成了紧密的强关联。

一个无可争议的共识是：AI 模型的发展已进入了推理引擎的阶段。

而推理引擎 " 外化 " 的最直观的产品形态，即是 Agent。对全球所有的基座模型玩家而言，" 通用 Agent" 已经是它们必须 " 内化 " 的关键能力。

它可以是基于模型和工程化强大能力的自动化编程，也可以是 Computer Use 和 Phone Use，可以用 CLI 的界面呈现给专业开发者，也可以保留 GUI 界面给普通的生产力创造型用户，但它们本质上都是模型自带的通用 Agent，是专业用户和普通用户消费 token 的 hub。

你甚至可以认为，token hub 就是 Agent。而 ATH，就是阿里巴巴 Agent，更准确点说，是阿里巴巴 Agent 能力的集合。

It's all about Token

顺着这个思路，你就更容易发现千问大模型系列的这次密集发布，与此前的模型亮相背后有着哪些根本的不同。

首先，它前所未有地强调场景导向。

此前千问系列的模型，往往强调 " 综合能力 " 的秀肌肉感—— MMLU、C-Eval、GSM8K 等等，都跑一遍，追求一个模型在所有维度的性能指标，都好看。

但这次的变化是：Qwen 3.6-plus 主打以编程为核心的 Agent 能力；Wan2.7-image 主打图像生成与编辑的 Agent 可调用能力；Qwen 3.5-omni 主打多模态交互的 vibe coding Agent 能力。面向不同场景，又都是 Agent 能力驱动。它不再追求在一个通用模型上，什么都能干，大多数 benchmark 都优秀，而转向在具体场景上，用不同的 Model as an Agent，完整地执行不同的任务。阿里巴巴的千问大模型系列，开始用实战表现而非综合指标的排名，来定义模型的能力。

而实战表现，最终指向的是 token 的消耗，从长期看，也就是收入的增长。

其次，它开始把千问模型定义为 Agent 的基础设施。

一直以来，千问大模型，准确地说是 Qwen，在普通用户和专业开发者的视角中，是两个完全不同的东西。普通用户觉得它是个免费的 chatbot，专业开发者觉得它是可以被灵活下载部署的开源模型，基于它衍生自己的模型，或开发自己的垂直 Agent。前者主要来自国内，后者更多聚集在硅谷。但与 ChatGPT 和 Claude 不遗余力的 Agent 化演进不同，Qwen 一直也没被广泛地认为具有强烈的 Agent 属性。现在事情起了变化。

Qwen3.6-Plus 基于其被证明的 Agentic Coding 能力，已被明确设计为 Agent 系统的推理引擎，而不是面向终端用户的聊天工具。它与 OpenClaw 和 Claude Code 等系统集成，充当推理层，这些工具负责执行和交互，模型更像是一个核心引擎，而非一个模型成品。这也解释了它具有 100 万 token 上下文窗口的意义：聊天场景下，用户一次消耗几百到几千 token，但 Agent 跑一个任务可能消耗几十万甚至上百万 token，100 万 token 的上下文可不是技术炫耀，而是 Agent 场景的刚需。

这应该是千问第一次真正地有了自己的 Agent 推理引擎，实现了 Model As an Agent。在几乎所有基座模型公司都意识到 Agent 才是调动 token 消费的第一生产力之后，千问也终于补上了这一环。

更重要的，是它第一时间接入了阿里巴巴的整个业务体系——更准确点说，是阿里巴巴的生产力业务体系。

过去，千问大模型的发布，就是发布模型本身，是通义实验室自己的事。它面向的 " 客户 "，是全球的 AI 开发者，主阵地是 Hugging Face、GitHub 和 Reddit。阿里巴巴旗下的各个业务单元并未受到直接的影响，甚至不同的业务单元还有自己的模型。

但这次三个模型发布的同时，阿里内部的 AI 应用体系第一时间全面接入：由钉钉脱胎而生的 AI 原生企业工作平台 " 悟空 "、千问 APP 和编程工具 Qoder 都在同一星期接入了上述三个模型。通义实验室的 " 客户 "，从全球几乎是免费使用的开发者，变成了阿里巴巴内部有 token 消费需求的生产力业务部门。至于内部怎么结算，那是另外一件事。

这背后的推手当然是 ATH 事业群。它把算力层、模型层、应用层并到一起，形成了 " 创造 token（千问模型）、输送 token（阿里云算力）和消费 token（悟空、千问 APP 等 AI 原生应用）" 的链路。千问大模型不再是一个孤立的业务单元，而是阿里 AI 业务体系的供给侧基础设施。至少，在模型和 Agent 能力第一时间接入内部相关业务单元这一点上，阿里巴巴的做法已经跟 Google 没什么两样了。

这三点变化，配合三款 " 千问系 " 模型的发布，一个底层逻辑正在浮现，那就是 " 大家都来用千问大模型 " 已经不够了，现在需要的是：" 大家都来用千问大模型，直接调用模型在不同场景下的 Agent 能力，直接完成工作，在千问上消费 token，给千问，包括阿里云甚至整个阿里巴巴，贡献收入 "。

模型是基石，Agent 是入口，模型与 Agent 驱动的 token 消耗，是增长引擎。

这个增长引擎转得起来么？

在千问 " 三连发 " 之后的第二天，即 2026 年 4 月 3 日，Qwen 3.6-plus 在全球最重要的模型调用平台 OpenRouter 上的调用量排名已位居第二。目前的第一名是小米的 MiMo-V2-Pro，一直靠免费占据头筹。而 Qwen 3.6-plus 这次是收费的，每百万 token 2 元，尽管比 Claude API 便宜得多，但它考验的是模型性能、Agent 引擎能力和综合性价比的整体，全球的开发者和 AI 专业用户都在这里用脚投票。

要知道，这恐怕是千问系列模型第一次在 OpenRouter 调用量榜单上排到前 10 的位置。千问不再只靠免费部署的开源小尺寸模型通吃开发者市场了，这是最重要的变化。与此同时，阿里云 AI 算力和存储产品最高涨价 34%，市场反应目前呈现供不应求。上下游互相拉动，正在形成商业闭环。

过去的一个月，通义实验室、千问大模型乃至整个阿里巴巴的 AI 战略被前所未有地放在聚光灯下审视：一些问题被暴露了，一些遗憾被留下了，一些动作被放大了。

但真正值得被关心的只有两个问题：其一，千问还能不能持续地发布 " 能打 " 的模型；其二，千问能给正在爆发的全球 token 消费市场带来什么，能给阿里巴巴带来什么。

现在来看，两个问题都找到了答案。

宙世代

一起剪

相关标签