钛媒体快报 10-24
香港中文大学联合趣丸科技开源MaskGCT语音大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

钛媒体 App 10 月 24 日消息,香港中文大学(深圳)与趣丸科技联合研发的语音大模型 "MaskGCT" 正式在 Amphion 系统中开源,面向全球用户开放使用。区别于传统 TTS 模型,该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越性能。 据介绍,MaskGCT 在三个 TTS 基准数据集上都达到了 SOTA 效果,性能超过当前最先进的同类模型,某些指标甚至超过人类水平。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

香港中文大学 开源 钛媒体 语音控制
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论