说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210574835.2 (22)申请日 2022.05.24 (71)申请人 网易 (杭州) 网络有限公司 地址 310000 浙江省杭州市滨江区长河街 道网商路59 9号4幢7层 (72)发明人 张唯 邱锋 曾豪 王苏振  张智勐 马博文 安入东 丁彧  吕唐杰 范长杰 胡志鹏  (74)专利代理 机构 北京市京大律师事务所 11321 专利代理师 何少岩 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/80(2022.01) G06V 20/40(2022.01) (54)发明名称 对象情绪的分析方法、 装置和电子设备 (57)摘要 本发明提供了一种对象情绪的分析方法、 装 置和电子设备; 其中, 该方法包括: 从目标对象相 关联的多媒体数据中提取静态面部特征和动态 特征; 动态特征包括表情变化特征、 声音特征和 语言内容特征中的一种或多种; 将静态面部特征 和动态特征输入至预先训练完成的对象情绪分 析模型中, 通过对象情绪分析模 型对静态面部特 征和动态特征进行特征融合处理, 进而输出情绪 分析结果。 该方式对静态面部特征和动态特征进 行特征融合处理, 由于动态特征中也包含表征情 绪的特征信息, 因而静态面部特征结合动态特征 进行情绪分析, 可以在一定程度上降低静态面部 特征中的干扰特征对情绪分析结果的影 响, 强化 表征情绪的特征信息的作用, 从而提高了情绪分 析结果的准确性。 权利要求书3页 说明书21页 附图4页 CN 115171176 A 2022.10.11 CN 115171176 A 1.一种对象情绪的分析 方法, 其特 征在于, 所述方法包括: 获取与目标对象相关联的多媒体数据, 从所述多媒体数据中提取所述目标对象的静态 面部特征和 动态特征; 其中, 所述动态特征包括所述目标对象的表情 变化特征、 声音 特征和 语言内容特 征中的一种或多种; 将所述静态面部特征和所述动态特征输入至预先训练完成的对象情绪分析模型中, 通 过所述对象情绪分析模型对所述静态面部特征和所述动态特征进 行特征融合处理, 得到融 合特征; 基于所述融合特 征输出所述目标对象的情绪分析 结果。 2.根据权利要求1所述的方法, 其特征在于, 从所述多媒体数据中提取所述目标对象的 动态特征的步骤, 包括: 如果所述动态特征中包括所述表情变化特征, 从所述多媒体数据中的视频数据中, 获 取指定的视频帧序列; 其中, 在所述视频帧序列中, 所述目标对象的表情动态变化; 通过预先训练完成的表情特征提取模型, 从所述视频帧序列提取所述目标对象的表情 变化特征。 3.根据权利要求1所述的方法, 其特征在于, 从所述多媒体数据中提取所述目标对象的 动态特征的步骤, 包括: 如果所述动态特征中包括所述声音特征, 从所述多媒体数据中的音频数据中, 获取指 定的音频序列; 其中, 所述音频序列中包括所述目标对象发出的声 音信号; 通过预先训练完成的声音特征提取模型, 从所述音频序列中提取所述目标对象的声音 特征; 其中, 所述声 音特征包括频率特 征、 音调特 征、 音高特 征和能量特 征中的一种或多种。 4.根据权利要求1所述的方法, 其特征在于, 从所述多媒体数据中提取所述目标对象的 动态特征的步骤, 包括: 如果所述动态特征中包括所述语言内容特征, 从所述多媒体数据中的字幕数据和/或 音频数据中, 获取 所述目标对象的语言内容文本; 通过预先训练完成的语言内容特征提取模型, 从所述语言内容文本 中提取所述目标对 象的语言内容特征; 其中, 所述语 言内容特征用于: 表征所述目标对象发出的语言的语言含 义。 5.根据权利要求1所述的方法, 其特征在于, 所述对象情绪分析模型中包括至少一个动 态特征处理模块, 所述动态特 征处理模块用于 输入对应类型的所述动态特 征; 所述通过所述对象情绪分析模型对所述静态面部特征和所述动态特征进行特征融合 处理, 得到融合特 征的步骤, 包括: 针对所述动态特征处理模块, 将所述动态特征处理模块对应的动态特征, 以及所述目 标对象的静态面部特 征输入至所述动态特 征处理模块; 通过所述动态特征提取模块中的注意力网络对所述静态面部特征和所述动态特征进 行特征融合处理, 得到融合特征; 其中, 所述融合特征中包括: 所述静态面部特征和所述动 态特征之间表征情绪的共同关键特 征。 6.根据权利要求5所述的方法, 其特征在于, 将所述动态特征处理模块对应的动态特 征, 以及所述 目标对象的静态面部特征输入至所述动态特征处理模块的步骤之前, 所述方 法还包括: 将所述动态特征输入至时序模型中, 输出所述动态特征的上下文特征; 其中, 所述上下权 利 要 求 书 1/3 页 2 CN 115171176 A 2文特征用于: 表征 所述动态特 征中特征随时间的变化趋势; 在所述上下文特征中添加时序位置信 息, 将添加有所述 时序位置信 息的所述上下文特 征, 确定为待输入至所述动态特征提取模块的动态特征; 其中, 所述时序位置信息用于: 指 示所述上 下文特征中特征在时序上的先后位置 。 7.根据权利要求5所述的方法, 其特征在于, 所述动态特征处理模块中的注意力网络包 括自注意力网络和交叉注意力网络; 所述通过所述动态特征提取模块中的注意力网络对所述静态面部特征和所述动态特 征进行特征融合处 理, 得到融合特 征的步骤, 包括: 对所述动态特征进行变换处理, 得到所述自注意力网络的第一输入参数, 将所述第一 输入参数输入至所述自注 意力网络中, 输出所述动态特征的中间特征; 其中, 所述中间特征 用于: 表征 所述动态特 征的自相关性; 基于所述中间特征确定所述交叉注意力网络的第 二输入参数, 基于所述静态面部特征 确定所述交叉注意力网络的第三输入参数, 将所述第二输入参数和所述第三输入参数输入 至所述交叉注意力网络, 得到 输出结果, 基于所述输出 结果确定所述融合特 征。 8.根据权利要求7所述的方法, 其特征在于, 所述基于所述中间特征确定所述交叉注意 力网络的第二输入参数的步骤, 包括: 将所述中间特征和所述动态特征进行第一融合处理, 得到第一融合结果; 对所述第一 融合结果进行变换处 理, 得到所述交叉注意力网络的第二输入参数。 9.根据权利要求7所述的方法, 其特征在于, 基于所述静态面部特征确定所述交叉注意 力网络的第三输入参数的步骤, 包括: 对所述静态面部特征进 行变换处理, 得到所述交叉注 意力网络的第三输入参数。 10.根据权利要求7所述的方法, 其特征在于, 基于所述输出结果确定所述融合特征的 步骤, 包括: 将所述输出结果和所述第 二输入参数对应的第 一融合结果进行第 二融合处理, 得到所 述第二融合结果; 其中, 所述第二输入参数通过 所述第一融合结果进行变换处 理后得到; 将所述第二融合结果输入至预设的第 一多层感知机 中, 通过所述第 一多层感知机对所 述第二融合结果进行映射处 理, 得到映射结果; 将所述映射结果和所述第二融合结果进行第三融合处 理, 得到所述融合特 征。 11.根据权利要求1所述的方法, 其特征在于, 所述对象情绪分析模型中包括多个动态 特征处理模块, 所述动态特征处理模块用于输入对应类型 的所述动态特征, 并输出所述动 态特征对应的融合特 征; 所述基于所述融合特 征输出所述目标对象的情绪分析 结果的步骤, 包括: 将所述动态特征处理模块输出的融合特征, 以及所述静态面部特征进行拼接处理, 得 到拼接特征; 将所述拼接特征输入至预设的第二多层感知机中, 输出所述 目标对象的情绪 分析结果。 12.根据权利要求11所述的方法, 其特征在于, 所述第二多层感知机包括多个分支网 络; 所述将所述拼接特征输入至预设的第 二多层感知机 中, 输出所述目标对象的情绪分析 结果的步骤, 包括:权 利 要 求 书 2/3 页 3 CN 115171176 A 3

.PDF文档 专利 对象情绪的分析方法、装置和电子设备

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对象情绪的分析方法、装置和电子设备 第 1 页 专利 对象情绪的分析方法、装置和电子设备 第 2 页 专利 对象情绪的分析方法、装置和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:49:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。