说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210633972.9 (22)申请日 2022.06.07 (71)申请人 昆明理工大 学 地址 650500 云南省昆明市呈贡区景明南 路727号 (72)发明人 相艳 柳如熙 陆婷 郭军军  (74)专利代理 机构 昆明隆合知识产权代理事务 所(普通合伙) 53220 专利代理师 何娇 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/211(2020.01) G06F 40/253(2020.01) G06N 3/04(2006.01) (54)发明名称 融合词性信息的方面级情感三元组抽取方 法 (57)摘要 本发明涉及融合词性信息的方面级情感三 元组抽取方法, 属情感分析领域。 本发明在模型 输入阶段融合词性信息, 加深模 型对数据自身语 义的理解; 然后以多任务学习的方式高效地完成 方面级情感三元组抽取任务, 其中, 使用两个标 注器来完成方面词和观点词的抽取, 使用 biaffine情感依赖解析器来充分学习方面词和 观点词之间的交互信息, 以判别方面词对应的情 感极性; 最后对三元组进行解码操作得到三元组 的跨度表示。 在SemEval公开的四个基准数据集 上进行了实验, 实验结果表明了本发 明在方面级 情感三元组抽取任务中的性能优于其余基线模 型, 从而验证了本发明融合词性信息的做法确实 有助于交 互建模, 最终得以提升模型的性能。 权利要求书2页 说明书12页 附图3页 CN 115048936 A 2022.09.13 CN 115048936 A 1.融合词性信息的方面级情感三元组抽取方法, 其特征在于: 所述融合词性信息的方 面级情感三元组抽取 方法的具体步骤如下: Step1、 基于文本的词向量表示及其对应的词性向量表示, 将二 者融合; Step2、 获得含有词性信息的融合特 征表示; Step3、 将融合特征表示输入多任务学习网络预测三元组, 即以词性信息为引导, 并行 完成方面词抽取、 观点词抽取、 情感极性 解析; Step4、 三元组解码, 根据启发式规则生成三元组跨度表示。 2.根据权利要求1所述的融合词性信 息的方面级情感三元组抽取方法, 其特征在于: 所 述Step1中, 使用预训练模型GloVe将输入句中的各个单词映射到一个低维向量空间, 获得 对应的词向量表示 其中d是词向量的维度; 对于输入序列 首先, 使用 NLTK词性标注器pos_tag为其中的每个单词标注词性标签, 然后, 给每个词性标签 分配一个 词性向量 d为词性向量的维度, 与词向量维度一致; 最后, 将每个单词的词性向量 与词向量 拼接得到融合特 征的向量表示fi。 3.根据权利要求1所述的融合词性信 息的方面级情感三元组抽取方法, 其特征在于: 所 述Step2中, 得到融合特征的向量表示fi之后, 使用Bi ‑LSTM网络来获取含有上下文信息的 表示 随后, 通过一个线性层和一次非线性变换, 实现降维的同时获取方面词和观点词的特 征表示; 在此, 未将隐藏层向量直接输入模型下一阶段的原因有两个: 其一, 隐藏层状态的 特征包含计算冗余信息, 有过拟合的风险; 其二, 该操作可剔除与方面词和观 点词无关的特 征。 4.根据权利要求1所述的融合词性信 息的方面级情感三元组抽取方法, 其特征在于: 所 述Step3中, 多任务学习网络架构包括两个部分: 方面词和观点词的抽取, 以及词级情感依 赖解析; 抽取方面词和观点词时, 网络模型采用{B,I,O}标记方案, 其中, B表示方面词或观 点词的起始 位置、 I表 示中间位置、 O表示其他; 将方面词和观点词的特征向量表示输入多任 务学习网络模型, 词级情感依赖解析过程中, 使用在句法依赖解析中具有较优的性能的 biaffine评分器来捕获每 个词对中两个词的交 互关系, 随后, 训练词级情感依赖解析器。 5.根据权利要求1所述的融合词性信 息的方面级情感三元组抽取方法, 其特征在于: 所 述Step4中, 使用启发式规则进行情感三元组解码, 以得到跨度表示的三元组; 具体将由 biaffine评分器产生的情感依赖 关系作为枢轴, 对方面词和观 点词标注器生 成的标签进 行 逆序遍历。 6.根据权利要求3所述的融合词性信 息的方面级情感三元组抽取方法, 其特征在于: 所 述Step2中, 通过一个线性层和一次非线性变换, 实现降维的同时获取方面词和观 点词的特 征表示的具体 计算过程如下: 其中, 分别为方面词和观点词的特征向量表示, dr为向量维度, 和 分别为可学习的权重和偏置, 此外, g( ·)是非线性函权 利 要 求 书 1/2 页 2 CN 115048936 A 2数ReLU(·), 即max(·, 0)。 7.根据权利要求4所述的融合词性信 息的方面级情感三元组抽取方法, 其特征在于: 所 述Step3中, 将方面词和观点词的特征向量表示输入多任务学习网络模型, 模型预测句中每 个词为方面词的概 率分布如(3)式所示, 观点词概 率分布如(4)式所示。 其中, 为权重矩阵、 为偏置, 两者均为训练参数, 分别为方面词和观点词的特 征向量表示, dr为向量维度。权 利 要 求 书 2/2 页 3 CN 115048936 A 3

.PDF文档 专利 融合词性信息的方面级情感三元组抽取方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 融合词性信息的方面级情感三元组抽取方法 第 1 页 专利 融合词性信息的方面级情感三元组抽取方法 第 2 页 专利 融合词性信息的方面级情感三元组抽取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。