说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111644051.4 (22)申请日 2021.12.3 0 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 彭涵宇 张玥 孙明明 李平  (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 代理人 武晨燕 王姗姗 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/268(2020.01) G06F 40/295(2020.01) G06F 16/36(2019.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种语义关系提取方法、 装置、 电子设备及 存储介质 (57)摘要 本公开提供了一种语义关系提取方法、 装 置、 电子设备及存储介质, 涉及人工智 能技术领 域, 尤其涉及自然语言 处理、 关系提取等领域。 具 体实现方案为: 从文本数据中获取待查询句子; 根据所述待查询句子中目标实体之间的封闭域 关系及开放域关系, 构建用于关系提取的语义关 系图; 根据所述语义关系图进行关系提取处理, 得到所述目标实体之间的语义关系。 采用本公 开, 可以从大量的文本数据中提取出目标实体 之 间的语义关系。 权利要求书4页 说明书13页 附图5页 CN 114266258 A 2022.04.01 CN 114266258 A 1.一种语义关系提取 方法, 包括: 从文本数据中获取待查询 句子; 根据所述待查询句子中目标实体之间的封闭域关系及开放域关系, 构建用于关系提取 的语义关系图; 根据所述语义关系图进行关系提取处 理, 得到所述目标实体之间的语义关系。 2.根据权利要求1所述的方法, 其中, 所述根据所述待查询句子中目标实体之间的封闭 域关系及开 放域关系, 构建用于关系提取的语义关系图, 包括: 根据开放域信息注释OIA, 将所述待查询 句子转换为对应的OIA图; 根据所述OIA图中的节点及边, 构建对应的所述语义关系图; 其中, 所述OIA图中的节点及边, 用于表征所述目标实体之间的封闭域关系及开放域关 系; 所述OIA图中的节点包括: 对应所述目标实体的目标节点。 3.根据权利要求2所述的方法, 其中, 所述语义关系图包括: 常量节点, 事实关系节点, 逻辑关系节点, 及连接所述常量节点、 所述事实关系节点及所述逻辑关系节点中至少 两个 节点形成的边; 其中, 所述常量节点, 用于描述所述目标实体; 所述事实关系节点, 用于描述所述目标实体之间的事实关系表达; 所述逻辑关系节点, 用于描述所述目标实体与开 放域事实之间的逻辑关系。 4.根据权利要求2所述的方法, 其中, 所述根据所述OIA图中的节点及边, 构建对应的所 述语义关系图, 包括: 在所述OIA图中, 标识对应目标实体对的目标节点对, 其中, 所述目标实体对包括至少 两个所述目标实体; 在所述OIA图中, 连接所述目标节点对形成的边, 得到对应的至少两个开放域事实路 径; 根据所述至少两个开放域事实路径上的所有节点及边, 得到所述语义关系图; 其中, 所 述所有节点中包括所述目标节点对、 及由所述待查询句子中除所述目标实体对之外的其他 词转换得到的多个非目标节点。 5.根据权利要求 4所述的方法, 还 包括: 在所述至少两个开 放域事实路径上, 执 行节点信息的查询处 理; 响应所述查询处理, 查询到所述至少两个开放域事实路径上的一条或多条节点链缺失 所述节点信息; 在所述一条或多条节点链上补全所述节点信息; 根据所述节点信息, 更新所述语义关系图。 6.根据权利要求 4所述的方法, 还 包括: 在所述至少两个开 放域事实路径上, 提取用于描述所述 开放域关系的节点表达式; 根据所述节点表达式, 得到开 放域事实; 根据所述 开放域事实, 更新所述语义关系图。 7.根据权利要求1 ‑6中任一项所述的方法, 其中, 所述根据 所述语义关系图进行关系提 取处理, 得到所述目标实体之间的语义关系, 包括:权 利 要 求 书 1/4 页 2 CN 114266258 A 2根据图神经网络提取第一关系信息, 其中, 所述第一关系信息包括所述语义关系图中 用于表征 所述目标实体之间关系的信息; 根据所述第 一关系信 息编码后将编码信 息输入第 一模型, 以得到所述目标实体之间的 语义关系。 8.根据权利要求7所述的方法, 其中, 所述根据所述第 一关系信 息编码后将编码信 息输 入第一模型, 以得到所述目标实体之间的语义关系, 包括: 根据所述第一关系信息进行编码, 得到包括第一特 征向量的所述编码信息; 将所述编码信息输入所述第一模型, 根据所述第一模型进行关系提取, 得到所述目标 实体之间的语义关系。 9.根据权利要求1 ‑6中任一项所述的方法, 其中, 所述根据 所述语义关系图进行关系提 取处理, 得到所述目标实体之间的语义关系, 包括: 根据图神经网络提取第一关系信息, 其中, 所述第一关系信息包括所述语义关系图中 用于表征 所述目标实体之间关系的信息; 根据所述第一关系信息进行编码, 得到第一特 征向量; 从所述文本数据中获取与 所述待查询句子相关的上下文信 息, 将所述上下文信 息编码 为第二特 征向量; 根据所述第 一特征向量和所述第 二特征向量得到融合特征向量, 将所述融合特征向量 输入第一模型, 以得到所述目标实体之间的语义关系。 10.根据权利要求1 ‑6中任一项所述的方法, 其中, 所述根据所述语义关系图进行关系 提取处理, 得到所述目标实体之间的语义关系, 包括: 根据图神经网络提取第一关系信息, 其中, 所述第一关系信息包括所述语义关系图中 用于表征 所述目标实体之间关系的信息; 根据所述第一关系信息进行编码, 得到包括第一特 征向量的编码信息; 将所述编码信息 输入第一模型, 根据第一模型进行关系提取, 得到第一语义关系; 从所述文本数据中获取与 所述待查询句子相关的上下文信 息, 将所述上下文信 息编码 为第二特 征向量; 将所述第一特 征向量输入第二模型进行关系提取, 得到第二语义关系; 根据所述第一语义关系和所述第二语义关系, 得到所述目标实体之间的语义关系。 11.一种语义关系提取装置, 包括: 获取单元, 用于从文本数据中获取待查询 句子; 构建单元, 用于根据所述待查询句子中目标实体之间的封 闭域关系及开放域关系, 构 建用于关系提取的语义关系图; 关系提取单元, 用于根据所述语义关系图进行关系提取处理, 得到所述目标实体之间 的语义关系。 12.根据权利要求1 1所述的装置, 其中, 所述构建单 元, 用于: 根据开放域信息注释OIA, 将所述待查询 句子转换为对应的OIA图; 根据所述OIA图中的节点及边, 构建对应的所述语义关系图; 其中, 所述OIA图中的节点及边, 用于表征所述目标实体之间的封闭域关系及开放域关 系;权 利 要 求 书 2/4 页 3 CN 114266258 A 3

.PDF文档 专利 一种语义关系提取方法、装置、电子设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种语义关系提取方法、装置、电子设备及存储介质 第 1 页 专利 一种语义关系提取方法、装置、电子设备及存储介质 第 2 页 专利 一种语义关系提取方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:55:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。