文|周鑫雨
编辑|苏建勋
《智能涌现》从多名独立信源处获悉,原腾讯 AI Lab 计算机视觉中心负责人、混元大模型技术负责人之一刘威于近日离职。
此外,AI Lab 计算机视觉中心暂时由 AI Lab 副主任俞栋管理。
对上述信息,截至发稿前,腾讯官方暂无回应。
多名从业者对《智能涌现》表示,刘威已经在新加坡创业,瞄准的还是视频生成领域。
原腾讯 AI Lab 计算机视觉中心负责人、混元大模型技术负责人刘威。图源:腾讯 AI 实验室微信公众号
在腾讯,具有 " 杰出科学家头衔 " 的刘威,最为人所知的身份是腾讯混元大模型的技术负责人之一。
此前,他曾任腾讯广告多媒体 AI 中心总监,带领团队基于混元大模型,研发了广告多媒体 AI 技术矩阵,提高了腾讯的广告转化效果和广告制作效率。
种种迹象表明,在验证落地场景和商业模式前,腾讯对视频生成的投入还十分谨慎。
一名从业者表示,图像、音频是目前腾讯多模态研究的重点:" 技术成熟,成本可控,而且比较容易找场景。" 比如,2024 年 11 月,微信公众号最新版本上线了 " 朗读音色 " 功能,用 AI 实现了音色克隆。
" 在腾讯,目前 CV 研究的主力在混元团队。但总体而言,腾讯对视频生成的人力和资源投入还不是很大。" 上述从业者表示。
另有相关人士表示,腾讯 AI Lab 计算机视觉中心所配备的人力向来很少,刘威创业后又带走了多名成员," 总体而言,AI Lab 对视频生成很佛 "。
有关是否大力投入视频生成模型,如今中国互联网公司已经分成了泾渭分明的两派:
大举投入派,以字节跳动和快手为代表。2024 年 6 月,快手发布了效果轰动一时的 " 可灵 AI";同年 9 月,不甘人后的字节一口气发了两款视频生成模型:Seaweed 和 PixelDance。
这些公司的特点在于,具有丰富的视频数据资源,以及能立刻与视频生成技术相结合业务场景。
而另一暂缓投入派,如百度,则对目前视频模型的商业回报,持有较为消极的态度。
此前《智能涌现》曾独家报道,在 2024 年 Q3 总监会上,百度董事长兼 CEO 李彦宏明确表示,Sora 这种视频生成的投入周期太长了,10 年、20 年都可能拿不到业务收益,那么无论多么火爆,百度都不去做。
而腾讯对视频生成模型的态度天平,也正在向保守和观望倾斜。在明确落地场景和商业化回报之前," 类 Sora" 的视频生成模型还不会成为腾讯挺进的领域。
欢迎交流!
登录后才可以发布评论哦
打开小程序可以发布评论哦