又一位清华大神加入 OpenAI!
刚刚,毕业清华大学数学系,曾在 Meta FAIR 工作 3.75 年、主导过SAM与Llama多项核心工作的研究员张鹏川(Pengchuan Zhang)宣布离职。
他的下一站,是来到 OpenAI,投身于世界模拟与机器人学(World Simulation and Robotics)方向的研究。
他在推特中写道,自己非常期待探索视觉感知、世界模型与机器人技术如何融合,构建真正的 " 物理智能 "。
OpenAI 世界模拟方向的负责人之一、Sora 项目资深领导Aditya Ramesh也第一时间留言欢迎。
从视觉理解到底层世界模型,这一步转向本身就很有意味。
那么,这位曾站在 SAM 与 Llama 核心位置的研究员,究竟是谁?
张鹏川是谁?
2007 年,张鹏川从重庆市南开中学高中毕业,考进清华大学,主修数学。
本科毕业后,他前往美国加州理工学院(Caltech)攻读博士,于 2017 年获得应用与计算数学博士学位。
博士期间,他专注于机器学习理论与应用,开始探索深度学习在视觉领域的潜力。
博士毕业后,他加入微软研究院,并在 Microsoft Research 雷德蒙德担任首席研究员。
期间,他领导了雷德蒙德实验室的计算机视觉与多模态智能研究工作。
同时还在微软内部跨组织推动计算机视觉与多模态智能项目,包括 Alexandar Multi-Modal 和 Florence 等方向。
值得一提的是,他在 2021 年还加入了华盛顿大学,担任电气与计算机工程系的兼职助理教授至今。
2022 年起,他转入 Meta FAIR(现 Meta 超级智能实验室),研究计算机视觉与多模态智能,累计工作近 4 年。
在此期间,他主导多项开创性项目,包括:
担任Segment Anything 3(SAM 3)项目负责人:SAM 3 是一个统一框架,可在图像和视频中实现目标检测、分割与跟踪。
作为 SAM 系列最新迭代(2025 年 11 月),该模型推出统一框架,支持图像和视频中的目标检测、分割与跟踪,实现零样本泛化到任意物体和场景。
担任Llama 3 视觉 grounding项目负责人,主导输入侧视觉 grounding 能力建设,使 Llama 3 成为首个在 Visual Commonsense Reasoning(视觉常识推理)基准上达到人类水平的开源模型。
担任Llama 4 视觉 grounding项目负责人,延续 Llama 3 优势,进一步强化专家级图像 grounding 能力(如像素级定位与复杂场景理解),被视为 Llama 4 对标 GPT-4o 的关键差异化亮点。
这些工作不仅提升了 Meta 的生成式 AI 竞争力,还为开源社区贡献了高影响力工具。
截至目前,张鹏川谷歌学术被引高达 34659 次!
One more thing
在张鹏川的推特下方,一位网友忍不住发问:
为什么突然之间所有人都在加入 OpenAI?我是挺兴奋的,但这是为什么?
这个疑问,其实并不突兀。
自 2025 年底以来,已经有多位业内知名人物陆续加入 OpenAI ——
括姚班大神陈立杰,Roblox 高管Arvind KC,《性能之巅》作者Brendan Gregg,以及从 Thinking Machines Lab 回流的Barret Zoph、Luke Metz、Sam Schoenholz等人。
与此同时,前段时间刷屏的 xAI 离职潮,也让不少人猜测——
OpenAI 会不会成为这些顶尖研究者的下一站?
对此,评论区有位网友回复得很直接:
因为(OpenAI)有算力 +Sora 级别的世界建模基础设施。如果没有这两样,到 2026 年几乎不可能做出真正高水平的机器人系统。
如果这条判断成立,那么张鹏川的选择,或许不只是一次个人职业转向。
也是 OpenAI 今年对 " 世界模型 + 物理智能 " 路线的下注。
让我们期待鹏川在 OpenAI 的工作!
参考链接:
[ 1 ] https://pzzhang.github.io/pzzhang/
[ 2 ] https://scholar.google.com/citations?hl=zh-CN&user=3VZ_E64AAAAJ&view_op=list_works
[ 3 ] https://x.com/PengchuanZ/status/2026189659228012558?s=20
— 欢迎 AI 产品从业者共建 —
「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。
一键关注 点亮星标
科技前沿进展每日见 w


登录后才可以发布评论哦
打开小程序可以发布评论哦