创作触手可及！喜马拉雅全新升级版“音剪AI”打通有声内容创作全链路

近期，喜马拉雅音频智能创作平台 " 音剪 AI" 全面升级，在底层模型、音频制作功能等方面实现多重突破，并发布支持外部 Agent 调用的 "AudiobookLM Skill"。无论是工作室、版权方等专业生产者，还是在校生、播客主播等个人创作者，都可上手体验，将个人创意变为有声作品。

底层模型与制作功能双升级，人人都可进行有声内容创作

新一代 " 音剪 AI" 实现从底层模型到音频制作功能的多项升级。其核心音频生成模型——喜马拉雅音频大模型，现已升级至 Audiobook-a2 版本，相比此前版本，当前版本在长篇章与长音频内容生成过程中，更少出现错读、漏读、异常停顿、声音跑偏等问题，可更稳定地承接有声书、多人播客、故事化内容等连续叙事场景。除音频内容生成外，还可进一步衔接画本、角色分析、后期合成等下游环节。据悉，喜马拉雅音频大模型早在 2024 年便通过了国家备案，是全国首个通过国家网信办备案的音频生成大模型。

其次，新增 " 智能后期 " 与 " 音色分配 " 功能。" 智能后期 " 功能可围绕文本内容自动识别场景氛围与情绪变化，智能匹配音效、背景音乐及表演提示。例如，当文中描写 " 倾盆大雨 " 时，音剪 AI 会自动匹配急促、密集的暴雨音效；出现武侠或动作类剧情时，系统则会自动添加 " 刀 "、" 剑 " 等击打音效。同时支持创作者自主上传音乐素材并建立个性化音乐库，根据创作习惯匹配常用的风格和素材，帮助提升后期制作效率。" 音色分配 " 功能则可基于文本内容辅助梳理不同角色的性格特征与叙事身份，为旁白与各种角色推荐合适音色，帮助创作者省去前期反复筛选与试音的时间。

此外，" 音剪 AI" 推出 " 人生留声机 " 玩法，以轻量化内容创作满足大众表达、记忆留存的需要。用户进入玩法页面后，可在 "AI 采访员 " 的引导下，通过语音讲述或文字形式回答问题，生成专属人生回忆录。例如，在 " 行至此地 · 地点故事 " 主题下，用户可能会被问到 " 有没有一个地方，是您一想到就会浮现出画面的 "。跟随引导完成后续问答后，系统会梳理采访内容并自动生成故事文案、合成音频，将个人记忆转化为可被聆听的数字作品，成品更可一键上传至喜马拉雅平台。

全面升级后的喜马拉雅音频智能创作平台 " 音剪 AI" 面向广大公众开放。不仅工作室、版权方等专业生产者可以系统性调用全链路创作工具开展团队协作，在校生、作家、播客主播等个人创作者也可以上手体验。

Skill版本同步发布，一句话调用有声内容创作全链路

喜马拉雅音频智能创作平台 " 音剪 AI" 也发布了外部 Agent 可调用的 Skill 版本—— "AudiobookLM Skill"，适配 WorkBuddy、Claude、Codex、OpenClaw、ChatGPT 等 AI 助手。创作者无需手动操作复杂流程、反复切换平台，即可通过外部 AI 助手快速调用 " 音剪 AI" 平台功能，协助完成文稿整理、章节导入、角色识别、整章合成、混音及发布上架等有声内容创作全链路流程。用户可通过 " 音剪 AI" 官网 - 服务中心 - 帮助中心获取 Skill 安装指南。

除创作赋能外，喜马拉雅也持续通过技术创新优化用户体验。2025 年 3 月，喜马拉雅自主研发的 " 小雅 " 智能语音助手上线并在此后完成多轮技术迭代与功能升级，陆续推出 AI 搜索、AI 听中问、AI 荐书等功能，持续优化用户语音交互体验。2026 年 5 月，" 小雅 Skill" 上线，使用户无需反复切换 App 便可通过 AI Agent 调用喜马拉雅平台内音频搜索、个性推荐、内容总结等服务，满足更多 AI 陪伴场景下的内容消费需求。

宙世代

一起剪

相关标签