说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210618881.8 (22)申请日 2022.06.01 (71)申请人 西北工业大 学 地址 710072 陕西省西安市友谊西路127号 (72)发明人 王震 聂弘毅 高超 李学龙  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 郭永丽 (51)Int.Cl. G06F 16/36(2019.01) G06N 5/02(2006.01) G06F 40/30(2020.01) (54)发明名称 关系三元组的抽取方法、 装置、 设备及存储 介质 (57)摘要 本申请公开一种关系三元 组的抽取方法、 装 置、 设备及存储介质, 涉及知识图谱技术领域, 能 够提高关系三元组抽取的准确率。 具体方案包 括: 获取目标文本, 目标文本中包括多个目标元 素; 根据目标文本、 预设的多层感知机模 型、 预设 的关系特征矩阵以及预设的关系权重矩阵, 得到 目标文本对应的张量, 关系特征矩阵用于指示文 本元素之间的语义关系, 关系权重矩阵用于指示 所述语义关系之间的相关性, 张量用于指示任意 两个目标元素是否满足当前语义 关系; 获取目标 文本中每个目标元素的元素类型, 元素类型包括 实体元素和非实体元素; 根据目标文本中每个目 标元素的元素类型和张量从目标文本中确定出 至少一个三元组集 合。 权利要求书2页 说明书12页 附图3页 CN 115146068 A 2022.10.04 CN 115146068 A 1.一种关系三元组的抽取 方法, 其特 征在于, 所述方法包括: 获取目标文本, 所述目标文本中包括多个目标 元素; 根据所述目标文本、 预设的多层感知机模型、 预设的关系特征矩阵以及预设的关系权 重矩阵, 得到所述 目标文本对应的张量, 所述关系 特征矩阵用于指示文本元素之间的语义 关系的特征, 所述关系权重矩阵用于指示所述语义关系之间的相关性, 所述语义关系中包 括所述目标元素之 间的目标语义关系, 所述张量用于指示任意两个目标元素是否满足当前 语义关系; 获取所述目标文本 中每个目标元素的元素类型, 所述元素类型包括实体元素和非实体 元素, 所述实体元 素包括实体开头元 素, 实体非开头元 素; 根据所述目标文本中每个目标元素的元素类型和所述张量从所述目标文本中确定出 至少一个三元组集合, 所述三元组集合中包括两个实体元素, 以及两个实体元素之间的语 义关系。 2.根据权利要求1所述的抽取方法, 其特征在于, 所述根据所述目标文本、 预设的多层 感知机模型、 预设的关系 特征矩阵以及预设的关系权重矩阵, 得到所述 目标文本对应的张 量, 包括: 对每个目标元素进行编码处 理, 得到所述目标文本的目标 特征序列矩阵; 根据所述目标特征序列矩阵、 所述多层感知机模型、 所述关系特征矩阵, 以及所述关系 权重矩阵, 得到所述目标文本对应的张量。 3.根据权利要求2所述的抽取方法, 其特征在于, 所述对每个目标元素进行编码处理, 得到所述目标文本的目标 特征序列矩阵, 包括: 获取每个目标元素对应的元 素向量, 得到所述目标文本的特 征序列矩阵; 将所述特征序列矩阵输入预设的双向长短期记忆模型中对所述特征序列矩阵进行编 码处理, 得到所述目标 特征序列矩阵。 4.根据权利要求2所述的抽取方法, 其特征在于, 所述根据所述目标特征序列矩阵、 预 设的多层感知机模型、 预设的关系 特征矩阵以及预设的关系权重矩阵, 得到所述 目标文本 对应的张量, 包括: 将所述目标特征序列矩阵分别输入至预设的第一多层感知机模型和第二多层感知机 模型中, 得到对应的第一特征矩阵和第二特征矩阵, 所述第一多层感知机模型和所述第二 多层感知机模型的预设参数不同, 所述第一特征矩阵用于指示所述实体元素中的主语元 素, 所述第二特 征矩阵用于指示所述实体元 素中的宾语元 素; 根据所述第一特征矩阵、 所述第 二特征矩阵、 所述特征矩阵以及所述关系权重矩阵, 得 到所述目标文本对应的张量。 5.根据权利要求4所述的抽取方法, 其特征在于, 所述根据所述第一特征矩阵、 所述第 二特征矩阵、 所述特 征矩阵以及所述关系权 重矩阵, 得到所述目标文本对应的张量, 包括: 将多个所述关系特 征矩阵进行叠加得到核心张量; 根据所述第一特征矩阵、 所述第二特征矩阵、 所述关系权重矩阵以及所述核心张量得 到所述目标文本对应的张量。 6.根据权利要求1所述的抽取方法, 其特征在于, 所述根据 所述目标文本 中每个目标元 素的元素类型和所述张量从所述目标文本中确定出至少一个三元组集 合, 包括:权 利 要 求 书 1/2 页 2 CN 115146068 A 2根据每个元素类型从所述目标文本中确定多个实体元素集合, 根据所述实体元素集合 和所述张量从所述目标文本中确定出至少一个三元组集 合。 7.根据权利要求2所述的抽取方法, 其特征在于, 所述获取所述目标文本 中每个目标元 素的元素类型, 包括: 将所述目标特征序列矩阵输入至预设的第三多层感知机模型中, 得到得分矩阵, 所述 得分矩阵用于指示每 个目标元素的元素类型评分; 根据所述得分矩阵以及预设的状态转移矩阵得到预测序列矩阵, 并从所述预测序列矩 阵中确定出所述目标文本中每个目标元素的元素类型, 所述状态转移矩阵用于指示元素类 型之间相互转移的概 率。 8.一种关系三元组的抽取装置, 其特 征在于, 所述装置包括: 第一获取模块, 用于获取目标文本, 所述目标文本中包括多个目标 元素; 第一处理模块, 用于根据 所述目标文本、 预设的多层感知机模型、 预设的关系特征矩阵 以及预设的关系权重矩阵, 得到所述 目标文本对应的张量, 所述关系 特征矩阵用于指示文 本元素之间的语义关系, 所述权重矩阵用于指示所述语义关系之间的相关性, 所述语义关 系中包括所述目标元素之 间的目标语义关系, 所述张量用于指示任意两个目标元素是否满 足当前语义关系; 第二获取模块, 用于获取所述目标文本中每个目标元素的元素类型, 所述元素类型包 括实体元 素和非实体元素, 所述实体元 素包括实体开头元 素, 实体非开头元 素; 第二处理模块, 用于根据所述目标文本 中每个目标元素的元素类型和所述张量从所述 目标文本中确定出至少一个三元组集合, 所述三元组集合中包括两个实体元素, 以及两个 实体元素之间的语义关系。 9.一种电子设备, 其特征在于, 包括存储器和 处理器, 所述存储器存储有计算机程序, 所述计算机程序被所述处理器执行时实现权利要求1至7中任一项所述的关系三元组的抽 取方法。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机程序, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的关系三元组的抽取 方法。权 利 要 求 书 2/2 页 3 CN 115146068 A 3

.PDF文档 专利 关系三元组的抽取方法、装置、设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 关系三元组的抽取方法、装置、设备及存储介质 第 1 页 专利 关系三元组的抽取方法、装置、设备及存储介质 第 2 页 专利 关系三元组的抽取方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:57:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。