说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210094662.4 (22)申请日 2022.01.26 (71)申请人 清华大学 地址 100084 北京市海淀区双清路3 0号清 华大学 (72)发明人 聂再清  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 王治东 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) (54)发明名称 一种基于篇章语境的多任务联合知识挖掘 方法及装置 (57)摘要 本发明提供一种基于篇章语境的多任务联 合知识挖掘方法及装置。 该方法包括: 确定待分 析的文本内容; 将文本内容输入到基于篇章语境 知识图谱的篇章知识挖掘模型内对文本内容中 的知识点进行多任务联合知识挖掘, 获得篇章知 识挖掘模型输出的知识挖掘结果; 篇章语境知识 图谱是对应各个知识挖掘任务的知识图谱, 包含 文本内容中实体知识、 实体关系及目标背景知识 信息; 所述目标背景知 识信息是从外部知识图谱 和所述文本内容中提取的与所述文本内容中实 体知识相对应的背景知 识信息。 本发 明提供的方 法, 通过基于包含目标背景知识信息的篇章语境 知识图谱构建的篇章知 识挖掘模 型, 能够有效识 别文本内容中知识点的关联性, 从而提升了知识 挖掘的精度。 权利要求书2页 说明书8页 附图2页 CN 114610894 A 2022.06.10 CN 114610894 A 1.一种基于篇 章语境的多任务联合知识挖掘方法, 其特 征在于, 包括: 确定待分析的文本内容; 将所述文本内容输入到基于篇章语境知识图谱的篇章知识挖掘模型内对所述文本内 容中的知识点进行多任务联合知识挖掘, 获得所述篇章知识挖掘模型输出的知识挖掘结 果; 其中, 所述篇章语境知识图谱是对应各个知识挖掘任务的知识图谱, 包含所述文本内 容中实体知识、 实体关系以及目标背景知识信息; 所述 目标背景知识信息是从外部知识图 谱和所述文本内容中提取的与所述文本内容中实体知识相对应的背景知识信息 。 2.根据权利要求1所述的基于篇章语境的多任务联合知识挖掘方法, 其特征在于, 还包 括: 基于所述知识挖掘结果对所述篇章语境知识图谱进行迭代更新, 以实现针对所述文本 内容产生更多实体知识的链接, 得到满足预设条件的知识挖掘结果。 3.根据权利要求2所述的基于篇章语境的多任务联合知识挖掘方法, 其特征在于, 基于 所述知识挖掘结果对所述篇章语境知识图谱进 行迭代更新, 以实现针对所述文本内容产生 更多实体知识的链接, 得到满足预设条件的知识挖掘结果, 具体包括: 对所述知识挖掘结果进行逻辑一致性检测, 并将检测通过的实体知识加入到所述篇章 语境知识图谱中, 获得新的篇 章语境知识图谱; 将所述文本内容输入到基于新的篇章语境知识图谱的篇章知识挖掘模型内对所述文 本内容中的知识 点进行下一轮的多任务联合知识挖掘和迭代更新, 直至不能挖掘出新的知 识点时输出满足预设条件的知识挖掘结果。 4.根据权利要求1所述的基于篇章语境的多任务联合知识挖掘方法, 其特征在于, 所述 确定待分析的文本内容, 具体包括: 获得初始的文本内容, 对所述初始的文本内容进行分段、 断句以及分词处理, 得到预处 理后的所述待分析的文本内容。 5.根据权利要求1所述的基于篇章语境的多任务联合知识挖掘方法, 其特征在于, 还包 括: 从所述文本 内容中提取相应的实体知识和实体关系, 基于所述实体知识和所述实体关 系构建所述文本内容对应的知识图谱; 从外部知识图谱和所述文本内容中提取与所述文本内容中实体知识相对应的目标背 景知识信息, 并将所述目标背 景知识信息加载到所述文本内容对应的知识图谱中得到篇章 语境知识图谱, 将所述篇章语境知识图谱输入到篇章知识挖掘模型, 确定基于篇章语境知 识图谱的篇 章知识挖掘模型。 6.一种基于篇 章语境的多任务联合知识挖掘装置, 其特 征在于, 包括: 文本预处 理单元, 用于确定待分析的文本内容; 知识挖掘单元, 用于将所述文本 内容输入到基于篇章语境知识图谱的篇章知识挖掘模 型内对所述文本内容中的知识点进行多任务联合知识挖掘, 获得所述篇章知识挖掘模型输 出的知识挖掘结果; 其中, 所述篇章语境知识图谱是用于各个知识挖掘任务的包含所述文 本内容中实体知识、 实体关系以及目标背景知识信息的知识图谱; 所述 目标背景知识信息 是从外部知识图谱和所述文本内容中提取的与所述文本内容中实体知识相对应的背景知 识信息。权 利 要 求 书 1/2 页 2 CN 114610894 A 27.根据权利要求6所述的基于篇章语境的多任务联合知识挖掘装置, 其特征在于, 所述 知识挖掘单元, 还用于基于所述知识挖掘结果对所述篇章语境知识图谱进行迭代更新, 以 实现针对所述文本内容产生更多实体知识的链接, 得到满足预设条件的知识挖掘结果。 8.根据权利要求7所述的基于篇章语境的多任务联合知识挖掘装置, 其特征在于, 所述 知识挖掘单 元, 具体用于: 对所述知识挖掘结果进行逻辑一致性检测, 并将检测通过的实体知识加入到所述篇章 语境知识图谱中, 获得新的篇 章语境知识图谱; 将所述文本内容输入到基于新的篇章语境知识图谱的篇章知识挖掘模型内对所述文 本内容中的知识 点进行下一轮的多任务联合知识挖掘和迭代更新, 直至不能挖掘出新的知 识点时输出满足预设条件的知识挖掘结果。 9.一种电子设备, 包括存储器、 处理器以及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至5任意一项 所述的基于篇 章语境的多任务联合知识挖掘方法的步骤。 10.一种处理器可读存储介质, 所述处理器可读存储介质上存储有计算机程序, 其特征 在于, 所述计算机程序被处理器执行时实现如权利要求 1至5任意一项 所述的基于篇章语境 的多任务联合知识挖掘方法的步骤。权 利 要 求 书 2/2 页 3 CN 114610894 A 3

.PDF文档 专利 一种基于篇章语境的多任务联合知识挖掘方法及装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于篇章语境的多任务联合知识挖掘方法及装置 第 1 页 专利 一种基于篇章语境的多任务联合知识挖掘方法及装置 第 2 页 专利 一种基于篇章语境的多任务联合知识挖掘方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。