谷歌Gemini上线音乐模型一句话即可生成歌曲

快科技 2 月 20 日消息，据媒体报道，谷歌宣布，其 Gemini 应用正式集成 DeepMind 旗下最先进的音乐生成模型 Lyria 3，用户仅凭一句文字描述或一张照片，即可在数秒内生成一段 30 秒的完整音乐片段。

据谷歌介绍，Lyria 3 的创作方式灵活多样：用户可以 " 描述一个想法 "，比如指定某种风格、情绪或节奏，模型便能自动生成包含人声、歌词和伴奏的歌曲；也可以上传照片或视频，Lyria 3 会分析画面氛围，创作出契合场景的配乐，并配有由 Nano Banana 设计的自定义封面。

此外，YouTube 创作者还可通过 Dream Track 功能探索 Lyria 3，为 Shorts 短视频配乐，该功能已在美国推出，并逐步推广至其他地区。

消息公布后，欧美流媒体音乐平台 Spotify 股价一度回吐日内近 5% 的涨幅，Sirius XM 也短暂转跌。有分析认为，虽然 Lyria 3 短期内不会对 Spotify 构成致命冲击，但可能倒逼其加快推出 AI 混音功能。

对于谷歌而言，将音频生成工具融入移动应用，既增强了消费者产品的竞争力，也向投资者展示了其 AI 投入的变现潜力。

若用户提示中提及真实音乐人，Gemini 只会将其视为 " 广泛的创作灵感来源 "，生成风格或氛围相似的作品，并设有过滤器防止输出侵权内容。同时，所有生成的曲目均使用 SynthID 技术添加了不易察觉的水印，便于检测 AI 创作内容。

生成式 AI 在音乐行业始终面临谨慎甚至敌视的态度，许多从业者担忧其可能威胁商业模式和知识产权。谷歌此次通过技术手段明确划定边界，试图在创新与保护之间寻求平衡。

目前 Lyria 3 已向全球 18 岁以上用户开放，支持英语、德语、西班牙语、法语、印地语、日语、韩语、葡萄牙语等语言，未来还将扩展更多语言并提升生成质量。

宙世代