太平洋电脑网 10-12
快手联合北大等开源新AI模型 可生成10秒24帧768P视频
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【太平洋科技快讯】近日,快手科技携手北京大学和北京邮电大学的研究团队,共同推出了一款名为 Pyramid Flow 的开源文生视频 AI 模型。该模型旨在为开发者、艺术家和创作者提供一种更高效、更灵活的视频生成解决方案。

在视频生成速度方面,Pyramid Flow 展现出卓越的性能。该模型能够在 56 秒内快速生成一段 5 秒、384p 的视频,其速度在同类模型中颇具竞争力,甚至超越了部分全序列扩散模型。

此外,Pyramid Flow 能够基于文本描述,生成最长 10 秒、1280x768 分辨率、24fps 的高质量视频。在视频质量、光影效果、运动动作一致性、文本语义还原和色彩搭配等方面,该模型均表现出色。

Pyramid Flow 模型引入了一种新颖的 " 金字塔流匹配 " 技术,通过分阶段生成视频来降低计算成本。与传统模型相比,它在大多数阶段使用低分辨率,仅在最终阶段达到全分辨率,有效减少了所需的 tokens 数量,仅为传统扩散模型的四分之一。

目前,Pyramid Flow 已正式在 Hugging Face 平台上线,并完全开源。这一创新技术的推出,不仅为视频生成领域带来了新的突破,也为处理和生成高维度视频数据提供了有效的解决方案。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

开源 ai 快手 分辨率
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论