爱奇艺如何用AI评估剧本角色的爆款潜力？

The following article is from 预言家游报 Author 娱子酱团队

作者 | 十五

互联网企业的专利申请背后，往往藏着全新的产品布局思路。这几年，虚拟人、元宇宙、AI 等概念的兴起之前，都伴随着大厂批量申请相关专利的动作。

因此，关注专利的布局方向，有助于外界预测未来 1-2 年可能落地的技术方向。还有一些专利和游戏新玩法、降本增效、企业社会责任等关系密切。

《预言家游报》的月度专利总结栏目，关注互联网大厂每月在专利方面的举动，对视频、音频、虚拟人、广告等领域进行相关技术溯源，追踪科技赋能商业的全过程。

音视频相关

剧本角色爆款探测器

专利申请方：上海爱奇艺新媒体科技有限公司

专利名称：角色评估方法、装置、电子设备及存储介质

申请进度：2025 年 4 月 29 日申请，2025 年 11 月 7 日公开

专利摘要：爱奇艺这个专利里面的大模型，会把剧本切成 " 人物设定、人物关系、成长线 " 三段文字，再分别给出 0-100 的分数。工作人员只需把剧本文件拖进系统，三十秒内就能看到哪一段得分偏低，例如 " 人物太平 " 或 " 情侣缺少火花 "，并收到具体的修改提示。以往判断角色是否吸粉全靠经验，开机后才发现人设站不住，重拍成本极高；现在编剧可在定稿前反复调整得分，不改到及格线就不锁剧本，减少盲拍带来的时间与资金浪费。

视频里谁摸了啥，秒懂

专利申请方：北京爱奇艺科技有限公司

专利名称：视频中互动关系的识别方法、装置、设备及介质

申请进度：2023 年 3 月 21 日申请，2025-11-28 公开

专利摘要：" 交并比拓扑图 " 是把人物框和物品框的重叠面积与总面积相除，得出两者空间关系。系统先对视频抽帧，做人 - 物交并比拓扑图，再输入图神经网络，直接输出 " 骑、拿、看 " 等动词标签。以往后期师要逐帧暂停画面，手写 " 谁拿了杯子 "，45 分钟剧集常需几天；现在 30 分钟可标完全片，标签准确率超过 85%，后续检索、剪辑、广告投放可直接调用，无需再人工逐秒核对。

分镜图角色不换脸

专利申请方：上海爱奇艺新媒体科技有限公司

专利名称：一种分镜图生成方法、装置、电子设备及存储介质

申请进度：2025 年 6 月 24 日申请，2025 年 11 月 7 日公开

专利摘要：多人手绘分镜时，同一人常出现发型、胡须不一致，服化道难以对照的问题。最近多个国内外生图模型已经具备了角色一致性能力，因此，这个专利实现了先用大模型根据剧本文字生成标准角色样貌，即 " 统一角色图 "，再自动替换到各分镜指定区域，保留原角度与表情，仅把面容换成标准图。这样，不论是人手还是 AI 出分镜，都在也不用因样貌不一而返工了。

云端切换广告参数

专利名称：一种广告投放方法、系统、存储介质及程序产品

申请进度：2024 年 12 月 27 日申请，2025 年 11 月 28 日公开

专利摘要：" 云端规则 " 可以理解成一张放在服务器上的打分表，表里写明了 " 什么机型、什么系统、什么习惯该看什么广告 "。手机第一次打开应用时，先把自己的型号、系统版本、最近使用时长读出来，对照这张表算出一个短标签，再把标签发回广告服务器；服务器收到后，立刻返回与标签对应的广告素材。过去若品牌临时撤档，必须重新打包 APP 并排队等待商店审核，通常要两三天，流量只能空转；如今只要改打分表，终端下一秒就能收到新素材，无需用户手动更新，也减少了旧广告继续播放的投诉风险。

准横竖屏弹幕体验对齐

专利申请方：上海哔哩哔哩科技有限公司

专利名称：弹幕显示方法以及装置

申请进度：2025 年 9 月 2 日申请，2025 年 11 月 4 日公开

专利摘要：传统弹幕飘过画面易遮挡主体，且横竖屏体验不一致。该专利在非全屏时，将视频与弹幕划分为上下或左右两个不相交区域，弹幕仅在独立条带内水平移动，并在进出边缘加透明度渐变。全屏时，弹幕自动隐藏，可随时切回条带模式。由此，兼顾沉浸与互动，减少渲染指令，使低端设备也能流畅运行。

游戏相关

云游戏传递手柄震动反馈

专利名称：基于云游戏的数据传输方法、设备及系统

申请进度：2022 年 11 月 22 日申请，2025 年 11 月 18 日公开

专利摘要：网页云游戏通常只传画面，手柄不会震动。这方面的最大问题是浏览器无权限，需要安装原生客户端才能访问震动接口，以及延迟无法把控。为此，B 站利用 Chromium 系浏览器的底层接口驱动手柄马达，全程不装插件。浏览器把手柄按键值 " 变了的部分 " 用 UDP 小报文发云端，获取返回的力反馈数据，保持毫秒级延迟。

自动抽帧制作 " 卡顿 " 风格

专利申请方：网易 ( 杭州 ) 网络有限公司

专利名称：游戏对象的风格化处理方法、装置及存储介质

申请进度：2021 年 12 月 30 日申请，2025 年 11 月 11 日公开

专利摘要：玩游戏 " 卡了 " 一般不是好事，但 " 卡顿 " 有时是一种美术风格。现有技术中的游戏视频文件难以直接进行抽帧风格化处理，制作 " 卡顿 " 动画需逐帧绘制，工作量大。该专利先获取含关键帧的游戏视频文件，再确定抽帧蓝图文件，按蓝图保留指定帧并删除其余帧，直接得到具有卡顿风格的目标视频文件，降低制作难度。

手指滑动连放技能

专利名称：一种游戏中虚拟技能交互方法、装置、设备及介质

申请进度：2023 年 3 月 14 日申请，2025 年 12 月 2 日公开

专利摘要：复杂的虚拟技能需分段点击或长按拖动，手指需多次抬起，操作繁琐且易错失时机。该专利先提供第一技能交互区域和位置指示标识，玩家滑动并停留，即可锁定目标技能位置；随后在同一界面弹出第二技能交互区域，再次滑动确定技能方向。整个过程无需抬手，实现 " 一指禅 " 式精准释放，丝般放大招。

AI 相关

人工数据标注成本

专利申请方：北京百度网讯科技有限公司

专利名称：大模型的训练方法、文本生成方法、装置、设备和介质

申请进度：2024 年 12 月 26 日申请，2025 年 11 月 14 日公开

专利摘要：随着 AI 发展，数据标注快速成为一个重要问题，人工标注成本显著提高，有效的人类数据越来越少。因此，既需要 AI 帮忙给语料打标签，也需要 AI 辅助生成类似的语料。该专利是典型的 " 教师 - 学生 " 模型架构，大参数的教师模型按知识、创作、闲聊等提示词生成高质量标注，再让轻量学生模型携带同类提示词微调，效果不足时动态补充数据或优化提示，实现一个模型覆盖多类对话续写推荐，降低标注成本。模型辅助标注的已知问题是，缺乏人类监督可能造成 " 语义垃圾 " 和低质量内容的自我循环。

解决语音合成音量不稳定的问题

专利名称：对称音频的获取方法、装置、电子设备及存储介质

申请进度：2021 年 12 月 22 日申请，2022 年 5 月 13 日公开，2025 年 11 月 7 日授权

专利摘要：在几年前还没有大模型的时候，就有了 Siri、小度等语音助手。但当时训练语音模型却苦于一个独特的问题：合成音频音量波动大，忽高忽低。这是因为训练用的音频材料波形不对称，会引发训练不稳定。本专利首先获取待处理的原始音频，进行相位谱偏移处理生成多个版本；通过波形对称检测，如使用打分函数评估对称度，筛选出波形最对称的目标音频。通过这种处理，降低语音合成出错率，音量保持稳定，合成结果更自然流畅。

数字人 / 元宇宙

全景视频植入广告不漂移

专利申请方：阿里巴巴（中国）有限公司

专利名称：多自由度视频的对象植入方法、电子设备及存储介质

申请进度：2021 年 11 月 8 日申请，2025 年 11 月 14 日公开

专利摘要：六自由度全景视频（6DoF）是一种新兴的媒体格式，它以三维方式捕捉拍摄对象，但允许从任何角度或任何位置进行回放。与 CG 生成的三维内容相比，6DoF 从真实场景中捕捉，能提供更逼真、更身临其境的体验。

如果你戴过 AR 眼镜就会知道，6DoF 视频视角变化大，容易发生植入内容在真实环境的错位。这个专利首先重建真实相机轨迹，并映射到虚拟坐标系，再将广告 RGB、深度、透明度三通道与虚拟轨迹绑定，实现任意视角精准贴合，同一素材可多场景复用。

基于头像照片的动捕

专利申请方：深圳市腾讯计算机系统有限公司

专利名称：表情生成方法、装置、计算机设备及存储介质

申请进度：2024 年 5 月 24 日申请，2025 年 11 月 25 日公开

专利摘要：用户只需上传照片，模型就能复制照片里的笑容、皱眉等表情，无需手工逐帧雕刻，大幅缩短动画和直播准备时间。电脑自动在一张带表情的照片上标出眼睛、嘴角等关键点；再把需要换表情的 3D 模型也标出同样的点，随后一点一点移动模型的顶点，让两组点完全对齐。移动过程由算法自动迭代。

虚幻角色骨骼导出 3DSMax

专利申请方：完美世界

专利名称：虚拟模型克隆方法和装置

申请进度：2025 年 11 月 7 日授权公告

专利摘要：UE4 调好的角色骨骼想进 3dsMax 继续用，但苦于格式不同？不必手搭。插件先导入原骨骼，自动提取每根骨的长度、粗细、朝向和父子关系；再按用户选的 " 世界坐标 "" 全属性匹配 " 或 " 镜像对称 " 三种方案，在目标软件里快速重建一套可编辑骨架，蒙皮数据也能一起复制。整个过程自动完成，避免错位、缺骨、左右手不对称等问题，省去大量人工对位时间。

公益民生

网易如何管理云音乐、大话等产品的区块链钱包

专利申请方：网易（杭州）网络有限公司

专利名称：一种钱包托管方法、系统、及存储介质

申请进度：2022 年 11 月 11 日申请，2025 年 12 月 2 日公开

专利摘要：这个专利体现出，在其申请的 2022 年，网易已经将区块链技术应用在了云音乐、大话西游等产品中，可能涉及数字音乐版权、虚拟商品交易、游戏内道具或代币等虚拟资产的管理等。由于网易的 App 内钱包是中心化存储的，使用区块链的意义可能在于确权，提供不可篡改的交易记录。本专利的核心创新在于，在钱包托管服务系统内部，根据应用的用户量级、性能需求和安全等级不同，让用户量大的云音乐 App 采用独立钱包系统，实现数据隔离；而用户量较小的游匿客、大话西游等则共享一个公共钱包系统，以节省资源。

手机外放低频不再破音

专利申请方：荣耀终端有限公司

专利名称：提高外放声音效果的方法及相关装置

申请进度：2021 年 8 月 19 日申请，2025 年 11 月 14 日公开

专利摘要：在手机扬声器播放低频，容易破音且耗电更大。荣耀在新方案中把功放供电分为三档：高音 4.4V、中音 8.8V、低音自动升至 15V，芯片按频段实时切换，既提升低音动态，又降低发热和功耗。

门锁徘徊报警

专利申请方：华为

专利名称：智能门锁的异常推送方法、存储介质及电子设备

申请进度：2025 年 12 月 2 日申请公布

专利摘要：门口有人却戴口罩、逆光或天黑，普通摄像头常认不出脸。华为把 AI 人脸检测和 ToF 测距结合：先以 3 秒一段扫脸，若始终无人脸但画面相对背景有变化，就转入轨迹模式，把门前区域划格计算目标移动的平均距离和方差。距离短、方差小→ " 徘徊 "，距离长、方差大→ " 路过 "，并再次回看全过程是否有人脸，确认后立刻停止录像，把异常逗留或有人经过的消息加密上传手机。既降低误报，又省电省流量，提升门锁安全。

宙世代

一起剪

相关标签