说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221074264 4.2 (22)申请日 2022.06.28 (71)申请人 华南师范大学 地址 528225 广东省佛山市南海区狮山 南 海软件园华 南师范大学软件学院 (72)发明人 曾碧卿 陈鹏飞 周斯颖  (74)专利代理 机构 广州骏思知识产权代理有限 公司 44425 专利代理师 张金龙 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 方面级情感分析方法、 装置、 电子设备及存 储介质 (57)摘要 本发明涉及一种方面级情感分析方法: 获取 待分析的目标文本及目标方面词; 对目标文本中 的第i个词进行掩码标记后, 输入预训练语言模 型获取第一向量表示; 对目标文本中的第i个词 和第j个词共同掩码标记后, 输入预训练语言模 型获取第二向量表示; 根据第一向量表示和第二 向量表示计算第i个词与第j个词间的影 响值, 根 据每两个词间的影 响值构建影 响矩阵; 从影响矩 阵中提取依赖树; 根据依赖树和目标方面词获得 局部上下文特征; 将目标文本和目标方面词输入 词嵌入模型, 得到全局词嵌入向量; 将全局词嵌 入向量和局部上下文特征融合, 得到融合特征; 根据融合特征进行预测, 得到目标方面词在目标 文本中的极性。 提高了对目标方面词的极性预测 的准确度。 权利要求书3页 说明书10页 附图4页 CN 115017916 A 2022.09.06 CN 115017916 A 1.一种方面级情感分析 方法, 其特 征在于, 包括 步骤: 获取待分析的目标文本及目标 方面词; 对所述目标文本中的第i个词进行掩码标记后, 将所述目标文本输入预训练语言模型 获取第i个词的第一向量表示; 对所述目标文本中的第i个词和第j个词共同进行掩码标记 后, 将所述目标文本输入预训练语 言模型获取第i个词的第二向量表示; 根据所述第一向量 表示和所述第二向量表示计算第i个词 与第j个词间的影响值, 根据所述目标文本中每两个 词间的所述影响值构建影响矩阵; 从所述影响矩阵中提取依赖树; 根据所述依赖树和所述 目标方面词获得 所述目标文本的局部上 下文特征; 将所述目标文本和所述目标 方面词共同输入词嵌入 模型, 得到全局词嵌入向量; 将所述全局词嵌入向量和所述局部上 下文特征进行特征融合, 得到融合特 征; 根据所述融合特 征进行预测, 得到所述目标 方面词在所述目标文本中的极性。 2.根据权利要求1所述的方法, 其特征在于, 根据 所述依赖树和所述目标方面词获得所 述目标文本的局部上 下文特征, 包括步骤: 根据所述依赖树获取所述目标文本中每个词与 所述目标方面词间的接近度值, 确定最 大的所述接近度值为动态阈值, 根据所述动态阈值通过上下文动态掩码或上下文动态加权 确定动态局部特 征, 确定所述动态局部特 征为局部上 下文特征。 3.根据权利要求1所述的方法, 其特征在于, 根据 所述依赖树和所述目标方面词获得所 述目标文本的局部上 下文特征, 包括步骤: 根据所述依赖树获取所述目标文本中每个词与 所述目标方面词间的接近度值, 确定最 大的所述接近度值为动态阈值, 根据所述动态阈值通过上下文动态掩码或上下文动态加权 确定动态局部特 征; 根据所述依赖树在所述目标文本 中提取所述目标方面词的依赖集群和被依赖集群, 其 中所述依赖集群为所述目标方面词的依赖词的集合, 所述被依赖集群为所述目标方面词的 被依赖词的聚合; 将所述动态局部特征分别与所述依赖集群、 所述被依赖集群进行融合, 得到局部依赖 特征和局部被依赖特 征; 根据所述局部依赖特 征和所述局部被依赖特 征得到局部上 下文特征。 4.根据权利要求3所述的方法, 其特征在于, 根据 所述依赖树和所述目标方面词获得所 述目标文本的局部上下文 特征, 还包括步骤: 提取所述目标文本中每个词的词性特征, 并将 所述词性特 征与所述动态局部特 征进行融合, 得到局部词性特 征; 将所述动态局部特征分别与所述依赖集群、 所述被依赖集群进行融合, 得到局部依赖 特征和局部被依赖特征后, 还包括步骤: 在局部依赖特征和局部被依赖特征中分别加入局 部词性特 征。 5.根据权利要求3 ‑4中任一项所述的方法, 其特征在于, 根据 所述局部依赖特征和所述 局部被依赖特 征得到局部上 下文特征, 包括步骤: 将所述局部依赖特征和所述局部被依赖特征分别进行多头注意力计算后, 进行池化, 得到依赖聚类特 征和被依赖聚类特 征; 将所述依赖聚类特征和所述被依赖聚类特征分别通过线性函数映射到 高维空间, 得到 高维向量, 再通过线性函数对所述高维向量进行计算, 得到局部依赖语义值和局部被依赖权 利 要 求 书 1/3 页 2 CN 115017916 A 2语义值; 根据所述局部依赖语义值和所述局部被依赖语义值通过门控机制得到局部上下文特 征, 所述局部上 下文特征的表达式为: 其中, 为所述局部上下文特征; VCDM/CDW为通过上下文动态掩码或上下文动态加权 确定的所述动态局部特征; Wjsub=Wsub*Rj, Wjgov=Wgov*(1‑Rj), Wsub为所述依赖集群, Wgov为所 述被依赖集群, Rj为重置函数, 重 置函数Rj的表达式为: Rj=sigmoid(Wr1·GSj+Wr2·SSj+br) 其中, Wr1和Wr2为可训练的参数; br为偏置项; GSj为所述局部被依赖语义值; SSj为所述局 部被依赖语义 值。 6.根据权利要求1所述的方法, 其特征在于, 将所述全局词嵌入向量和所述局部上下文 特征进行特征融合, 得到融合特 征, 包括步骤: 将所述全局词嵌入向量和所述局部上下文特征进行拼接后, 通过PCT模型进行融合, 并 通过多头注意力进行编码, 得到融合特 征。 7.一种方面级情感分析装置, 其特 征在于, 包括: 获取模块, 用于获取待分析的目标文本及目标 方面词; 局部上下文特征获取模块, 用于对所述目标文本中的第 i个词进行掩码标记后, 将所述 目标文本输入预训练语 言模型获取第i个词的第一向量表示; 对所述目标文本中的第i个词 和第j个词共同进 行掩码标记后, 将所述目标文本输入预训练语 言模型获取第i个词的第二 向量表示; 根据所述第一向量表示和所述第二向量表示计算第i个词与第j个词间的影响 值, 根据所述 目标文本中每两个词间的所述影响值构建影响矩阵; 从所述影响矩阵中提取 依赖树; 根据所述依赖树和所述目标 方面词获得 所述目标文本的局部上 下文特征; 全局词嵌入向量获取模块, 用于将所述目标文本和所述目标方面词共同输入词嵌入模 型, 得到全局词嵌入向量; 特征融合模块, 用于将所述全局词嵌入向量和所述局部上下文特征进行特征融合, 得 到融合特 征; 预测模块, 用于根据所述融合特征进行预测, 得到所述目标方面词在所述目标文本中 的极性。 8.根据权利要求7 所述的装置, 其特 征在于, 所述局部上 下文特征获取模块包括: 动态局部特征获取子模块, 用于根据 所述依赖树获取所述目标文本 中每个词与所述目 标方面词间的接近度值, 确定最大 的所述接近度值为动态阈值, 根据所述动态阈值通过上 下文动态掩码或上下文动态加权确定动态局部特征, 确定所述动态局部特征为局部上下文 特征。 9.一种电子设备, 其特 征在于: 包括: 处理器; 存储器, 用于存 储由所述处 理器执行的计算机程序; 其中, 所述处 理器执行所述计算机程序时实现权利要求1 ‑6中任一项所述方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机程序, 所述计算机程序权 利 要 求 书 2/3 页 3 CN 115017916 A 3

.PDF文档 专利 方面级情感分析方法、装置、电子设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 方面级情感分析方法、装置、电子设备及存储介质 第 1 页 专利 方面级情感分析方法、装置、电子设备及存储介质 第 2 页 专利 方面级情感分析方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。