近日谷歌方面宣布,旗下 Gemini AI 聊天机器人的 Gemini Live 功能将支持 40 多种语言,并率先支持法语、德语、葡萄牙语、印地语和西班牙语,后续会推出对更多语言的支持。同时,这一功能现已面向所有 Android 用户开放。
据悉,Gemini Live 支持用户与 Gemini 进行语音交互,同时该功能采用了增强型语音引擎,可以使得 Gemini 展开更连贯、更有情感表现力、更逼真的多轮对话。用户可在对话过程中随时打断,并提出新的问题或是更正信息,对此 Gemini 则会实时调整、并作出响应,从而提供更加自然流畅的对话体验。
对此曾有相关报道指出,Gemini Live 是谷歌为了应对 OpenAI 在 ChatGPT 中引入高级语音模式(Advanced Voice Mode)而开发。有消息显示,有测试者在使用过 Gemini Live 后表示,该语音助手在持续对话能力上明显优于其他文本助手。
据了解,此前在 9 月初,谷歌方面就曾宣布 Gemini 将在最新版本的更新中采用 Gemini 1.5 Flash 大模型(以下简称为 1.5 Flash)。据谷歌方面透露,其在改善延迟方面取得了重大进步,采用 1.5 Flash 的 Gemini 响应速度得到了大幅提升、增幅最高可达 50%,更新后的 Gemini 可为用户带来更加流畅、高效的体验,从而帮助用户以更少的时间来处理各种问题。
值得一提的是,不久前谷歌方面还对 Gemini 1.5 系列模型进行了更新,推出 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 两款新的模型。据悉,这两款模型的整体质量均得到了提升,具备更快的响应速度、更强大的性能,以及更低的成本。其中 Gemini-1.5-Flash-002 的延迟较此前版本降低了 3 倍,输出速度提升了 2 倍。对此谷歌方面表示,这两款模型能够在保持内容安全标准的同时,提供更有帮助的回复。
而在成本方面,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 具备更简洁的样式,旨在易于使用、并降低成本。对于文本摘要、问答、信息提取等使用案例,据称这两款模型的默认输出长度较此前版本缩短了 5% 至 20%。
【本文图片来自网络】
登录后才可以发布评论哦
打开小程序可以发布评论哦