近期,喜马拉雅音频智能创作平台 " 音剪 AI" 全面升级,在底层模型、音频制作功能等方面实现多重突破,并发布支持外部 Agent 调用的 "AudiobookLM Skill"。无论是工作室、版权方等专业生产者,还是在校生、播客主播等个人创作者,都可上手体验,将个人创意变为有声作品。

底层模型与制作功能双升级,人人都可进行有声内容创作
新一代 " 音剪 AI" 实现从底层模型到音频制作功能的多项升级。其核心音频生成模型——喜马拉雅音频大模型,现已升级至 Audiobook-a2 版本,相比此前版本,当前版本在长篇章与长音频内容生成过程中,更少出现错读、漏读、异常停顿、声音跑偏等问题,可更稳定地承接有声书、多人播客、故事化内容等连续叙事场景。除音频内容生成外,还可进一步衔接画本、角色分析、后期合成等下游环节。据悉,喜马拉雅音频大模型早在 2024 年便通过了国家备案,是全国首个通过国家网信办备案的音频生成大模型。
其次,新增 " 智能后期 " 与 " 音色分配 " 功能。" 智能后期 " 功能可围绕文本内容自动识别场景氛围与情绪变化,智能匹配音效、背景音乐及表演提示。例如,当文中描写 " 倾盆大雨 " 时,音剪 AI 会自动匹配急促、密集的暴雨音效;出现武侠或动作类剧情时,系统则会自动添加 " 刀 "、" 剑 " 等击打音效。同时支持创作者自主上传音乐素材并建立个性化音乐库,根据创作习惯匹配常用的风格和素材,帮助提升后期制作效率。" 音色分配 " 功能则可基于文本内容辅助梳理不同角色的性格特征与叙事身份,为旁白与各种角色推荐合适音色,帮助创作者省去前期反复筛选与试音的时间。
此外," 音剪 AI" 推出 " 人生留声机 " 玩法,以轻量化内容创作满足大众表达、记忆留存的需要。用户进入玩法页面后,可在 "AI 采访员 " 的引导下,通过语音讲述或文字形式回答问题,生成专属人生回忆录。例如,在 " 行至此地 · 地点故事 " 主题下,用户可能会被问到 " 有没有一个地方,是您一想到就会浮现出画面的 "。跟随引导完成后续问答后,系统会梳理采访内容并自动生成故事文案、合成音频,将个人记忆转化为可被聆听的数字作品,成品更可一键上传至喜马拉雅平台。
全面升级后的喜马拉雅音频智能创作平台 " 音剪 AI" 面向广大公众开放。不仅工作室、版权方等专业生产者可以系统性调用全链路创作工具开展团队协作,在校生、作家、播客主播等个人创作者也可以上手体验。
Skill版本同步发布,一句话调用有声内容创作全链路
喜马拉雅音频智能创作平台 " 音剪 AI" 也发布了外部 Agent 可调用的 Skill 版本—— "AudiobookLM Skill",适配 WorkBuddy、Claude、Codex、OpenClaw、ChatGPT 等 AI 助手。创作者无需手动操作复杂流程、反复切换平台,即可通过外部 AI 助手快速调用 " 音剪 AI" 平台功能,协助完成文稿整理、章节导入、角色识别、整章合成、混音及发布上架等有声内容创作全链路流程。用户可通过 " 音剪 AI" 官网 - 服务中心 - 帮助中心获取 Skill 安装指南。
除创作赋能外,喜马拉雅也持续通过技术创新优化用户体验。2025 年 3 月,喜马拉雅自主研发的 " 小雅 " 智能语音助手上线并在此后完成多轮技术迭代与功能升级,陆续推出 AI 搜索、AI 听中问、AI 荐书等功能,持续优化用户语音交互体验。2026 年 5 月," 小雅 Skill" 上线,使用户无需反复切换 App 便可通过 AI Agent 调用喜马拉雅平台内音频搜索、个性推荐、内容总结等服务,满足更多 AI 陪伴场景下的内容消费需求。


登录后才可以发布评论哦
打开小程序可以发布评论哦