凌晨告别，千问“灵魂人物”为何在巅峰时离场？

一句 "bye my beloved qwen"，藏尽不舍与决绝。

3 月 4 日凌晨，一则英文帖子在社交媒体上悄然传播。阿里巴巴通义千问（Qwen）的技术负责人林俊旸写道："me stepping down. bye my beloved qwen."（我卸任了。再见了，我亲爱的千问。）据悉，林俊旸已于 3 月 3 日下午正式递辞，Qwen 团队内部同步消息后，有知情者透露，部分同事当场落泪。截至发稿，阿里官方沉默不语，林俊旸未披露去向，但业内风声已起：多位投资人和头部企业，早已向这位技术猛将抛来橄榄枝。

几乎同时，团队的后训练负责人郁博文也宣布离职。而早在 1 月，Qwen Code 的负责人惠彬原已转投 Meta。短短两个月，这支标杆团队的三位核心负责人相继离开。

据多方信息证实，这一系列人事变动的直接导火索，是阿里云通义实验室对 Qwen 团队组织模式的根本性重塑。

原先，Qwen 团队是 " 垂直整合 " 的，从预训练、后训练到具体模态开发，都由一个团队贯穿。这种模式沟通链路短，目标统一，迭代迅速。但如今，实验室计划将其拆解，转向 " 水平分工 " ——未来会成立独立的预训练、后训练、文本、多模态等团队，协作关系从内部紧密耦合变为模块化对接。

这一调整直接导致了林俊旸管理范围的显著缩小。作为原垂直团队的总负责人，他需要统筹从底层基础设施到上层模型应用的全链条。而组织分拆后，他的职权很可能被限制在某个特定环节。更重要的是，这种 " 打散 " 团队的做法，与林俊旸本人长期以来秉持的技术理念存在分歧。

在过去一年中，他曾多次公开或内部表达观点，认为在大型模型研发进入深水区的当下，预训练、后训练以及底层基础设施（Infra）团队之间需要更紧密的结合与无缝沟通，而非割裂。事实上，Qwen 团队从 2024 年中后期就开始尝试组建自己的专属 Infra 团队，以更直接地支撑模型训练需求，这部分职能原本主要由阿里云的人工智能平台 PAI 统一提供。林俊旸推动的这一尝试，本身就体现了他对 " 一体化 " 研发效率的追求。当公司决策走向相反的 " 水平分工 " 时，理念冲突成了他离开的关键。

一人离场，多米诺骨牌彻底倒了，回看履历，能清晰看到他们对 Qwen 的烙印。

林俊旸（花名：靖舟），1993 年出生，是阿里最年轻的 P10 之一。他的背景横跨工科与人文：本科在北京大学攻读计算机科学，硕士却转向了外国语学院的语言学与应用语言学。这种训练塑造了他独特的视角——将语言逻辑转化为机器可理解的框架。2019 年硕士毕业后，他加入阿里巴巴达摩院，参与了早期多模态预训练模型 M6 的研发。2022 年底，随着达摩院相关团队并入阿里云成立通义实验室，林俊旸被正式任命为通义千问系列大模型的技术负责人。在他的主导下，Qwen 系列完成了从闭源到全面开源的战略转身，并迅速在全球开发者社区建立起巨大影响力。

郁博文，2022 年中科院博士毕业，以 " 阿里星 " 身份入达摩院，天赋与实力双在线。作为后训练负责人，负责的是模型在预训练之后的关键精调环节，包括指令遵循、人类偏好对齐、安全伦理约束等，这直接决定了模型最终的用户体验和可靠性。

而惠彬原领导的 Qwen Code，则是 Qwen 生态中专注于代码生成与理解能力的子品牌，其离职加入 Meta，也反映了国际科技巨头对顶尖 AI 人才的激烈争夺。惠彬原离职后，林俊旸曾亲自接管 Qwen Code 相关工作，直至此次卸任。

核心人员的变动，发生在一个微妙的时刻。

就在林俊旸卸任前两天，3 月 2 日晚，阿里巴巴集团刚宣布了一项重大的品牌整合决定：将旗下所有大模型产品线统一命名为 " 千问 "（Qwen），此前使用的 " 通义千问 " 等名称将逐步退出。品牌统一的目的是为了减少用户认知混乱，集中力量打造一个清晰的市场入口，这与全球 AI 行业趋势一致。同日，团队还开源了 4 款主打端侧部署的小尺寸模型（Qwen3.5-0.8B/2B/4B/9B），甚至吸引了埃隆 · 马斯克的点赞。林俊旸当时还转发了消息致谢。品牌升级与技术发布的热度未散，核心舵手却突然告别，这种反差令外界倍感意外。

不可否认，在他们带领下，千问取得了瞩目成绩。

从 2023 年 8 月首次开源以来，Qwen 系列模型参数规模覆盖从 0.5B 到万亿级别，构建了包含语言、数学、代码及多模态的完整能力体系。截至 2026 年初，其在全球开源社区 Hugging Face 上的衍生模型数量已突破 20 万款，累计下载量超过 10 亿次，超越了 Meta 的 Llama 系列，成为全球最活跃的开源大模型生态之一。

技术里程碑同样坚实。2025 年 4 月发布的 Qwen3 混合推理模型采用了先进的 MoE 架构。同年发布的旗舰模型 Qwen3-Max 参数规模超万亿，在 GPQA 等专业科学测试中超越了同期国际主流模型。其增强版 Qwen3-Max-Thinking 在 AIME、HMMT 等高难度数学竞赛中取得了满分。根据 2025 年 SuperCLUE 年度中文大模型基准测评，其综合得分位列全球第六。在 LMSYS Chatbot Arena 全球盲测、MMLU 等综合基准中，Qwen 系列长期稳居全球前七，是中文语境下能力最全面的模型之一。

除了技术评测，商业化和国际影响力也在突破。2026 年 2 月，国际奥委会官方宣布，基于千问大模型打造了奥运史上首个官方大模型，应用于 2026 年米兰冬奥会的赛务调度、转播信号分发及交通指挥等核心系统。2025 年 11 月，面向消费者的 " 千问 "App 上线后，七天下载量便突破 1000 万次。

眼下，通义实验室正试图用 " 水平分工 " 应对新挑战。这种模式在业内并非没有先例，旨在提升专业化与规模效率。但它也带来新问题：各环节目标如何统一？协作损耗是否会抵消专业收益？尤其对大模型研发而言，这种调整的效果尚待观察。

来源：星河商业观察

宙世代

一起剪

相关标签