谷歌在近期举行的 I/O 开发者大会上宣布了一系列面向开发者的 AI 创作工具升级,旨在通过最新的 Gemini 模型家族,降低多媒体内容的生成门槛并提升效率。在视频和多模态创作领域,谷歌发布了全新的 Gemini Omni 模型。该模型能够理解并处理文本、图像、音频和视频输入,并生成连贯的视频内容。其最突出的特点是支持对话式编辑,用户只需用自然语言描述修改需求,如更换角色、调整光线或改变场景,模型便能自动完成编辑。(新浪财经)

谷歌在近期举行的 I/O 开发者大会上宣布了一系列面向开发者的 AI 创作工具升级,旨在通过最新的 Gemini 模型家族,降低多媒体内容的生成门槛并提升效率。在视频和多模态创作领域,谷歌发布了全新的 Gemini Omni 模型。该模型能够理解并处理文本、图像、音频和视频输入,并生成连贯的视频内容。其最突出的特点是支持对话式编辑,用户只需用自然语言描述修改需求,如更换角色、调整光线或改变场景,模型便能自动完成编辑。(新浪财经)
登录后才可以发布评论哦
打开小程序可以发布评论哦