娱乐资本论 昨天
爱奇艺如何用AI评估剧本角色的爆款潜力?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

The following article is from 预言家游报 Author 娱子酱团队

作者 | 十五

互联网企业的专利申请背后,往往藏着全新的产品布局思路。这几年,虚拟人、元宇宙、AI 等概念的兴起之前,都伴随着大厂批量申请相关专利的动作。

因此,关注专利的布局方向,有助于外界预测未来 1-2 年可能落地的技术方向。还有一些专利和游戏新玩法、降本增效、企业社会责任等关系密切。

《预言家游报》的月度专利总结栏目,关注互联网大厂每月在专利方面的举动,对视频、音频、虚拟人、广告等领域进行相关技术溯源,追踪科技赋能商业的全过程。

音视频相关

01

剧本角色爆款探测器

专利申请方:上海爱奇艺新媒体科技有限公司

专利名称:角色评估方法、装置、电子设备及存储介质

申请进度:2025 年 4 月 29 日申请,2025 年 11 月 7 日公开

专利摘要:爱奇艺这个专利里面的大模型,会把剧本切成 " 人物设定、人物关系、成长线 " 三段文字,再分别给出 0-100 的分数。工作人员只需把剧本文件拖进系统,三十秒内就能看到哪一段得分偏低,例如 " 人物太平 " 或 " 情侣缺少火花 ",并收到具体的修改提示。以往判断角色是否吸粉全靠经验,开机后才发现人设站不住,重拍成本极高;现在编剧可在定稿前反复调整得分,不改到及格线就不锁剧本,减少盲拍带来的时间与资金浪费。

02

视频里谁摸了啥,秒懂

专利申请方:北京爱奇艺科技有限公司

专利名称:视频中互动关系的识别方法、装置、设备及介质   

申请进度:2023 年 3 月 21 日申请,2025-11-28 公开   

专利摘要:" 交并比拓扑图 " 是把人物框和物品框的重叠面积与总面积相除,得出两者空间关系。系统先对视频抽帧,做人 - 物交并比拓扑图,再输入图神经网络,直接输出 " 骑、拿、看 " 等动词标签。以往后期师要逐帧暂停画面,手写 " 谁拿了杯子 ",45 分钟剧集常需几天;现在 30 分钟可标完全片,标签准确率超过 85%,后续检索、剪辑、广告投放可直接调用,无需再人工逐秒核对。

03

分镜图角色不换脸

专利申请方:上海爱奇艺新媒体科技有限公司   

专利名称:一种分镜图生成方法、装置、电子设备及存储介质   

申请进度:2025 年 6 月 24 日申请,2025 年 11 月 7 日公开   

专利摘要:多人手绘分镜时,同一人常出现发型、胡须不一致,服化道难以对照的问题。最近多个国内外生图模型已经具备了角色一致性能力,因此,这个专利实现了先用大模型根据剧本文字生成标准角色样貌,即 " 统一角色图 ",再自动替换到各分镜指定区域,保留原角度与表情,仅把面容换成标准图。这样,不论是人手还是 AI 出分镜,都在也不用因样貌不一而返工了。

04

云端切换广告参数

专利名称:一种广告投放方法、系统、存储介质及程序产品   

申请进度:2024 年 12 月 27 日申请,2025 年 11 月 28 日公开   

专利摘要:" 云端规则 " 可以理解成一张放在服务器上的打分表,表里写明了 " 什么机型、什么系统、什么习惯该看什么广告 "。手机第一次打开应用时,先把自己的型号、系统版本、最近使用时长读出来,对照这张表算出一个短标签,再把标签发回广告服务器;服务器收到后,立刻返回与标签对应的广告素材。过去若品牌临时撤档,必须重新打包 APP 并排队等待商店审核,通常要两三天,流量只能空转;如今只要改打分表,终端下一秒就能收到新素材,无需用户手动更新,也减少了旧广告继续播放的投诉风险。

05

准横竖屏弹幕体验对齐

专利申请方:上海哔哩哔哩科技有限公司   

专利名称:弹幕显示方法以及装置   

申请进度:2025 年 9 月 2 日申请,2025 年 11 月 4 日公开   

专利摘要:传统弹幕飘过画面易遮挡主体,且横竖屏体验不一致。该专利在非全屏时,将视频与弹幕划分为上下或左右两个不相交区域,弹幕仅在独立条带内水平移动,并在进出边缘加透明度渐变。全屏时,弹幕自动隐藏,可随时切回条带模式。由此,兼顾沉浸与互动,减少渲染指令,使低端设备也能流畅运行。

游戏相关

01

云游戏传递手柄震动反馈

专利名称:基于云游戏的数据传输方法、设备及系统   

申请进度:2022 年 11 月 22 日申请,2025 年 11 月 18 日公开   

专利摘要:网页云游戏通常只传画面,手柄不会震动。这方面的最大问题是浏览器无权限,需要安装原生客户端才能访问震动接口,以及延迟无法把控。为此,B 站利用 Chromium 系浏览器的底层接口驱动手柄马达,全程不装插件。浏览器把手柄按键值 " 变了的部分 " 用 UDP 小报文发云端,获取返回的力反馈数据,保持毫秒级延迟。

自动抽帧制作 " 卡顿 " 风格   

专利申请方:网易 ( 杭州 ) 网络有限公司

专利名称:游戏对象的风格化处理方法、装置及存储介质   

申请进度:2021 年 12 月 30 日申请,2025 年 11 月 11 日公开   

专利摘要:玩游戏 " 卡了 " 一般不是好事,但 " 卡顿 " 有时是一种美术风格。现有技术中的游戏视频文件难以直接进行抽帧风格化处理,制作 " 卡顿 " 动画需逐帧绘制,工作量大。该专利先获取含关键帧的游戏视频文件,再确定抽帧蓝图文件,按蓝图保留指定帧并删除其余帧,直接得到具有卡顿风格的目标视频文件,降低制作难度。

手指滑动连放技能

专利名称:一种游戏中虚拟技能交互方法、装置、设备及介质   

申请进度:2023 年 3 月 14 日申请,2025 年 12 月 2 日公开   

专利摘要:复杂的虚拟技能需分段点击或长按拖动,手指需多次抬起,操作繁琐且易错失时机。该专利先提供第一技能交互区域和位置指示标识,玩家滑动并停留,即可锁定目标技能位置;随后在同一界面弹出第二技能交互区域,再次滑动确定技能方向。整个过程无需抬手,实现 " 一指禅 " 式精准释放,丝般放大招。

AI 相关

人工数据标注成本

专利申请方:北京百度网讯科技有限公司   

专利名称:大模型的训练方法、文本生成方法、装置、设备和介质   

申请进度:2024 年 12 月 26 日申请,2025 年 11 月 14 日公开   

专利摘要:随着 AI 发展,数据标注快速成为一个重要问题,人工标注成本显著提高,有效的人类数据越来越少。因此,既需要 AI 帮忙给语料打标签,也需要 AI 辅助生成类似的语料。该专利是典型的 " 教师 - 学生 " 模型架构,大参数的教师模型按知识、创作、闲聊等提示词生成高质量标注,再让轻量学生模型携带同类提示词微调,效果不足时动态补充数据或优化提示,实现一个模型覆盖多类对话续写推荐,降低标注成本。模型辅助标注的已知问题是,缺乏人类监督可能造成 " 语义垃圾 " 和低质量内容的自我循环。

解决语音合成音量不稳定的问题

专利名称:对称音频的获取方法、装置、电子设备及存储介质   

申请进度:2021 年 12 月 22 日申请,2022 年 5 月 13 日公开,2025 年 11 月 7 日授权   

专利摘要:在几年前还没有大模型的时候,就有了 Siri、小度等语音助手。但当时训练语音模型却苦于一个独特的问题:合成音频音量波动大,忽高忽低。这是因为训练用的音频材料波形不对称,会引发训练不稳定。本专利首先获取待处理的原始音频,进行相位谱偏移处理生成多个版本;通过波形对称检测,如使用打分函数评估对称度,筛选出波形最对称的目标音频。通过这种处理,降低语音合成出错率,音量保持稳定,合成结果更自然流畅。

数字人 / 元宇宙

全景视频植入广告不漂移

专利申请方:阿里巴巴(中国)有限公司   

专利名称:多自由度视频的对象植入方法、电子设备及存储介质   

申请进度:2021 年 11 月 8 日申请,2025 年 11 月 14 日公开  

专利摘要:六自由度全景视频(6DoF)是一种新兴的媒体格式,它以三维方式捕捉拍摄对象,但允许从任何角度或任何位置进行回放。与 CG 生成的三维内容相比,6DoF 从真实场景中捕捉,能提供更逼真、更身临其境的体验。

如果你戴过 AR 眼镜就会知道,6DoF 视频视角变化大,容易发生植入内容在真实环境的错位。这个专利首先重建真实相机轨迹,并映射到虚拟坐标系,再将广告 RGB、深度、透明度三通道与虚拟轨迹绑定,实现任意视角精准贴合,同一素材可多场景复用。

基于头像照片的动捕

专利申请方:深圳市腾讯计算机系统有限公司   

专利名称:表情生成方法、装置、计算机设备及存储介质   

申请进度:2024 年 5 月 24 日申请,2025 年 11 月 25 日公开

专利摘要:用户只需上传照片,模型就能复制照片里的笑容、皱眉等表情,无需手工逐帧雕刻,大幅缩短动画和直播准备时间。电脑自动在一张带表情的照片上标出眼睛、嘴角等关键点;再把需要换表情的 3D 模型也标出同样的点,随后一点一点移动模型的顶点,让两组点完全对齐。移动过程由算法自动迭代。

虚幻角色骨骼导出 3DSMax

专利申请方:完美世界

专利名称:虚拟模型克隆方法和装置

申请进度:2025 年 11 月 7 日授权公告

专利摘要:UE4 调好的角色骨骼想进 3dsMax 继续用,但苦于格式不同?不必手搭。插件先导入原骨骼,自动提取每根骨的长度、粗细、朝向和父子关系;再按用户选的 " 世界坐标 "" 全属性匹配 " 或 " 镜像对称 " 三种方案,在目标软件里快速重建一套可编辑骨架,蒙皮数据也能一起复制。整个过程自动完成,避免错位、缺骨、左右手不对称等问题,省去大量人工对位时间。

公益民生

网易如何管理云音乐、大话等产品的区块链钱包

专利申请方:网易(杭州)网络有限公司

专利名称:一种钱包托管方法、系统、及存储介质

申请进度:2022 年 11 月 11 日申请,2025 年 12 月 2 日公开

专利摘要:这个专利体现出,在其申请的 2022 年,网易已经将区块链技术应用在了云音乐、大话西游等产品中,可能涉及数字音乐版权、虚拟商品交易、游戏内道具或代币等虚拟资产的管理等。由于网易的 App 内钱包是中心化存储的,使用区块链的意义可能在于确权,提供不可篡改的交易记录。本专利的核心创新在于,在钱包托管服务系统内部,根据应用的用户量级、性能需求和安全等级不同,让用户量大的云音乐 App 采用独立钱包系统,实现数据隔离;而用户量较小的游匿客、大话西游等则共享一个公共钱包系统,以节省资源。

手机外放低频不再破音

专利申请方:荣耀终端有限公司   

专利名称:提高外放声音效果的方法及相关装置

申请进度:2021 年 8 月 19 日申请,2025 年 11 月 14 日公开    

专利摘要:在手机扬声器播放低频,容易破音且耗电更大。荣耀在新方案中把功放供电分为三档:高音 4.4V、中音 8.8V、低音自动升至 15V,芯片按频段实时切换,既提升低音动态,又降低发热和功耗。

门锁徘徊报警

专利申请方:华为   

专利名称:智能门锁的异常推送方法、存储介质及电子设备   

申请进度:2025 年 12 月 2 日申请公布   

专利摘要:门口有人却戴口罩、逆光或天黑,普通摄像头常认不出脸。华为把 AI 人脸检测和 ToF 测距结合:先以 3 秒一段扫脸,若始终无人脸但画面相对背景有变化,就转入轨迹模式,把门前区域划格计算目标移动的平均距离和方差。距离短、方差小→ " 徘徊 ",距离长、方差大→ " 路过 ",并再次回看全过程是否有人脸,确认后立刻停止录像,把异常逗留或有人经过的消息加密上传手机。既降低误报,又省电省流量,提升门锁安全。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 专利 the 互联网 专利申请
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论