快科技 2 月 20 日消息,据媒体报道,谷歌宣布,其 Gemini 应用正式集成 DeepMind 旗下最先进的音乐生成模型 Lyria 3,用户仅凭一句文字描述或一张照片,即可在数秒内生成一段 30 秒的完整音乐片段。
据谷歌介绍,Lyria 3 的创作方式灵活多样:用户可以 " 描述一个想法 ",比如指定某种风格、情绪或节奏,模型便能自动生成包含人声、歌词和伴奏的歌曲;也可以上传照片或视频,Lyria 3 会分析画面氛围,创作出契合场景的配乐,并配有由 Nano Banana 设计的自定义封面。
此外,YouTube 创作者还可通过 Dream Track 功能探索 Lyria 3,为 Shorts 短视频配乐,该功能已在美国推出,并逐步推广至其他地区。

消息公布后,欧美流媒体音乐平台 Spotify 股价一度回吐日内近 5% 的涨幅,Sirius XM 也短暂转跌。有分析认为,虽然 Lyria 3 短期内不会对 Spotify 构成致命冲击,但可能倒逼其加快推出 AI 混音功能。
对于谷歌而言,将音频生成工具融入移动应用,既增强了消费者产品的竞争力,也向投资者展示了其 AI 投入的变现潜力。
若用户提示中提及真实音乐人,Gemini 只会将其视为 " 广泛的创作灵感来源 ",生成风格或氛围相似的作品,并设有过滤器防止输出侵权内容。同时,所有生成的曲目均使用 SynthID 技术添加了不易察觉的水印,便于检测 AI 创作内容。
生成式 AI 在音乐行业始终面临谨慎甚至敌视的态度,许多从业者担忧其可能威胁商业模式和知识产权。谷歌此次通过技术手段明确划定边界,试图在创新与保护之间寻求平衡。
目前 Lyria 3 已向全球 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语、葡萄牙语等语言,未来还将扩展更多语言并提升生成质量。



登录后才可以发布评论哦
打开小程序可以发布评论哦