一句 "bye my beloved qwen",藏尽不舍与决绝。
3 月 4 日凌晨,一则英文帖子在社交媒体上悄然传播。阿里巴巴通义千问(Qwen)的技术负责人林俊旸写道:"me stepping down. bye my beloved qwen."(我卸任了。再见了,我亲爱的千问。)据悉,林俊旸已于 3 月 3 日下午正式递辞,Qwen 团队内部同步消息后,有知情者透露,部分同事当场落泪。截至发稿,阿里官方沉默不语,林俊旸未披露去向,但业内风声已起:多位投资人和头部企业,早已向这位技术猛将抛来橄榄枝。
几乎同时,团队的后训练负责人郁博文也宣布离职。而早在 1 月,Qwen Code 的负责人惠彬原已转投 Meta。短短两个月,这支标杆团队的三位核心负责人相继离开。
据多方信息证实,这一系列人事变动的直接导火索,是阿里云通义实验室对 Qwen 团队组织模式的根本性重塑。
原先,Qwen 团队是 " 垂直整合 " 的,从预训练、后训练到具体模态开发,都由一个团队贯穿。这种模式沟通链路短,目标统一,迭代迅速。但如今,实验室计划将其拆解,转向 " 水平分工 " ——未来会成立独立的预训练、后训练、文本、多模态等团队,协作关系从内部紧密耦合变为模块化对接。
这一调整直接导致了林俊旸管理范围的显著缩小。作为原垂直团队的总负责人,他需要统筹从底层基础设施到上层模型应用的全链条。而组织分拆后,他的职权很可能被限制在某个特定环节。更重要的是,这种 " 打散 " 团队的做法,与林俊旸本人长期以来秉持的技术理念存在分歧。
在过去一年中,他曾多次公开或内部表达观点,认为在大型模型研发进入深水区的当下,预训练、后训练以及底层基础设施(Infra)团队之间需要更紧密的结合与无缝沟通,而非割裂。事实上,Qwen 团队从 2024 年中后期就开始尝试组建自己的专属 Infra 团队,以更直接地支撑模型训练需求,这部分职能原本主要由阿里云的人工智能平台 PAI 统一提供。林俊旸推动的这一尝试,本身就体现了他对 " 一体化 " 研发效率的追求。当公司决策走向相反的 " 水平分工 " 时,理念冲突成了他离开的关键。
一人离场,多米诺骨牌彻底倒了,回看履历,能清晰看到他们对 Qwen 的烙印。
林俊旸(花名:靖舟),1993 年出生,是阿里最年轻的 P10 之一。他的背景横跨工科与人文:本科在北京大学攻读计算机科学,硕士却转向了外国语学院的语言学与应用语言学。这种训练塑造了他独特的视角——将语言逻辑转化为机器可理解的框架。2019 年硕士毕业后,他加入阿里巴巴达摩院,参与了早期多模态预训练模型 M6 的研发。2022 年底,随着达摩院相关团队并入阿里云成立通义实验室,林俊旸被正式任命为通义千问系列大模型的技术负责人。在他的主导下,Qwen 系列完成了从闭源到全面开源的战略转身,并迅速在全球开发者社区建立起巨大影响力。
郁博文,2022 年中科院博士毕业,以 " 阿里星 " 身份入达摩院,天赋与实力双在线。作为后训练负责人,负责的是模型在预训练之后的关键精调环节,包括指令遵循、人类偏好对齐、安全伦理约束等,这直接决定了模型最终的用户体验和可靠性。
而惠彬原领导的 Qwen Code,则是 Qwen 生态中专注于代码生成与理解能力的子品牌,其离职加入 Meta,也反映了国际科技巨头对顶尖 AI 人才的激烈争夺。惠彬原离职后,林俊旸曾亲自接管 Qwen Code 相关工作,直至此次卸任。
核心人员的变动,发生在一个微妙的时刻。
就在林俊旸卸任前两天,3 月 2 日晚,阿里巴巴集团刚宣布了一项重大的品牌整合决定:将旗下所有大模型产品线统一命名为 " 千问 "(Qwen),此前使用的 " 通义千问 " 等名称将逐步退出。品牌统一的目的是为了减少用户认知混乱,集中力量打造一个清晰的市场入口,这与全球 AI 行业趋势一致。同日,团队还开源了 4 款主打端侧部署的小尺寸模型(Qwen3.5-0.8B/2B/4B/9B),甚至吸引了埃隆 · 马斯克的点赞。林俊旸当时还转发了消息致谢。品牌升级与技术发布的热度未散,核心舵手却突然告别,这种反差令外界倍感意外。
不可否认,在他们带领下,千问取得了瞩目成绩。
从 2023 年 8 月首次开源以来,Qwen 系列模型参数规模覆盖从 0.5B 到万亿级别,构建了包含语言、数学、代码及多模态的完整能力体系。截至 2026 年初,其在全球开源社区 Hugging Face 上的衍生模型数量已突破 20 万款,累计下载量超过 10 亿次,超越了 Meta 的 Llama 系列,成为全球最活跃的开源大模型生态之一。
技术里程碑同样坚实。2025 年 4 月发布的 Qwen3 混合推理模型采用了先进的 MoE 架构。同年发布的旗舰模型 Qwen3-Max 参数规模超万亿,在 GPQA 等专业科学测试中超越了同期国际主流模型。其增强版 Qwen3-Max-Thinking 在 AIME、HMMT 等高难度数学竞赛中取得了满分。根据 2025 年 SuperCLUE 年度中文大模型基准测评,其综合得分位列全球第六。在 LMSYS Chatbot Arena 全球盲测、MMLU 等综合基准中,Qwen 系列长期稳居全球前七,是中文语境下能力最全面的模型之一。
除了技术评测,商业化和国际影响力也在突破。2026 年 2 月,国际奥委会官方宣布,基于千问大模型打造了奥运史上首个官方大模型,应用于 2026 年米兰冬奥会的赛务调度、转播信号分发及交通指挥等核心系统。2025 年 11 月,面向消费者的 " 千问 "App 上线后,七天下载量便突破 1000 万次。
眼下,通义实验室正试图用 " 水平分工 " 应对新挑战。这种模式在业内并非没有先例,旨在提升专业化与规模效率。但它也带来新问题:各环节目标如何统一?协作损耗是否会抵消专业收益?尤其对大模型研发而言,这种调整的效果尚待观察。
来源:星河商业观察


登录后才可以发布评论哦
打开小程序可以发布评论哦