量子位 前天
多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

最初说不做视频生成模型的百度,现在在视频生成的路上一路狂奔!

就在刚刚,百度蒸汽机(MuseSteamer)视频生成大模型升级至 2.0 版本,主打多人有声音视频一体化生成。

话不多说,直接来看效果:

蒸汽机 2.0 更加擅长复杂运镜,用镜头讲故事的能力也更强,画质进一步提升。

再来看下面这个展示,美人鱼的鱼鳞、脸上的妆容细节都精致得很,人物的表演、情绪、声音全都一体化生成:

除了 " 正经 " 玩法,还能拿它来整活,比如让身穿古代盔甲的武士坐在那打麻将:

或者让他踩缝纫机绣花:

将图片转换成不同风格的视频也可以:

目前用户可通过百度搜索 " 百度蒸汽机 " 或登录 " 绘想 " 平台体验。

蒸汽机 2.0 总共有四个版本:Turbo 版、Lite 版、Pro 版以及有声版。

另外,百度蒸汽机 2.0 全系模型还登陆了百度智能云,企业用户可在百度千帆大模型平台使用蒸汽机 API 的服务。

价格方面低至行业 70%,蒸汽机 Turbo 有声版价格 2.5 元 / 秒,限时优惠两周 1.4 元 /5 秒。

更多效果让人眼前一亮

下面来看更多效果展示。

人在海边吹风,海浪和海鸥的音效很自然:

生成科幻大片,也很有那味儿了:

让 " 王爷 " 和 " 王妃 " 穿越时空坐飞机去迪士尼玩,这场面真的很难不笑:

又或者是生成卡通视频,各种风格都能行:

发布会现场,百度还请来了专业影视视效指导姚骐,姚骐曾参与过《黑客帝国 3》《变形金刚 3》等多部好莱坞大片,还有国产科幻剧《三体》的视效工作。

姚骐在现场展示了其用百度蒸汽机 2.0 制作的科幻短片《归途》,并表示 " 蒸汽机让好莱坞级大片镜头不再需要百万预算 "。

首创多模态潜在空间规划

在技术方面,百度透露了蒸汽机的几大秘诀。

首先,百度蒸汽机行业首次实现多人有声音视频一体化生成,语音与唇形、表情、动作的毫秒级精准对齐,复杂场景下依然稳定。

另外,团队首创多模态潜在空间规划技术(Latent Multi-Modal Planner),自主协调多角色身份、情感与互动逻辑,保障电影级叙事连贯性。

蒸汽机还有个特点是深度适配中文场景,以超 98% 的还原度精准呈现中文语音细节与情感表达。

画质方面,端到端电影级画质生成,通过精准主体动态刻画,打造真实细腻的人物表现力。

运镜方面,采用大师级运镜控制,内置数十种专业镜头语言,精准响应文本指令,实现视觉细节与创意意图的完美对齐。

为啥百度现在重仓视频生成?

为什么百度一开始不做视频生成模型,现在又来了个大反转?

百度给出了答案是——蒸汽机的研发是由应用驱动模型研发。

百度内部各个实际场景和业务,像搜索、由百万创作者组成的内容生态、分发内容的百度信息流,还有各个垂类以及百度商业,都对视频生成模型有强烈需求。

目前,百度蒸汽机已在百度移动生态广泛使用,进一步强化了百度搜索、内容、商业等生态的多模态体验。

活动上,百度还分享了蒸汽机在多个场景的落地应用。

比如在一汽大众揽境的七夕主题营销案例中,百度蒸汽机作为核心引擎,打造了行业首支汽车类 AIGC 创意视频《揽境天阶 · 七夕重逢》。

伊利倍畅成人羊奶粉的 AI 整合营销案例中,通过百度蒸汽机,制作了伊利倍畅首支 AIGC 品牌宣传片《漂 " 羊 " 过海来看你》。

说白了,百度做蒸汽机,不是追风口,而是自家生态里的 " 刚需 " 推着往前走。

感兴趣的友友可以去薅羊毛免费体验了~

官网链接:https://huixiang.baidu.com/?from=pc_meiti_1

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

 8 月 22 日本周五下午 14 点,量子位 AI 沙龙邀请了RockFlow 创始人、CEO 赖蕴琦 Vakee,一同来聊AI Agent,怎么搞投资?

 欢迎线下参会!面对面交流 AI Agent、金融投资与 AI 创业   

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

百度 好莱坞 效果 三体
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论