说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210561543.5 (22)申请日 2022.05.20 (71)申请人 国家电网有限公司大 数据中心 地址 100052 北京市西城区骡马市大街18 号中再中心 申请人 北京中电普华信息技 术有限公司   国网浙江省电力有限公司 (72)发明人 沈亮 欧阳红 何鑫 高士杰  朱广新 陈翔 廖小琦 张鹏宇  李杏 占震滨 陈小明 张伟  颜克礼 刘玉  (74)专利代理 机构 北京汇知杰知识产权代理有 限公司 1 1587 专利代理师 李洁 魏文浩(51)Int.Cl. G06F 40/30(2020.01) G06F 40/295(2020.01) G06Q 10/04(2012.01) G06Q 50/06(2012.01) (54)发明名称 基于电网公共数据模型的实体关系预测的 方法及装置 (57)摘要 本发明提供了一种基于电网公共数据模型 的实体关系预测的方法, 包括: 获取电网公共数 据模型的实体文件和关系文件, 提取第一类三元 组数据集; 将第一类三元组数据集, 与电网公共 数据模型的实体文件进行匹配, 提取第二类三元 组数据集; 第一类三元组数据集和第二类三元组 数据集, 输入到不同的语义识别模型中, 输出第 一类三元组数据集和第二类三元组数据集的关 系预测分数; 将第一类三元 组数据集合集的关系 预测分数, 与第二类三元组数据集的关系预测分 数融合, 输出关系预测结果。 本发明减少人工关 系推理可能出现的错误, 以及人员对电网公共数 据模型的理解不够而导致的匹配错误的情况, 为 电网公共数据模型的扩 展提供可靠的依据。 权利要求书3页 说明书12页 附图4页 CN 115204179 A 2022.10.18 CN 115204179 A 1.一种基于电网公共数据模型的实体关系预测的方法, 其特 征在于, 所述方法包括: 获取电网公共数据模型的实体文件和关系 文件, 提取以头实体语义信 息和尾实体语义 信息作为输入, 关系类别作为输出, 生成的三元组数据集, 作为第一类三元组数据集; 将所述第一类三元组数据集, 与所述电网公共数据模型的实体文件进行匹配, 提取匹 配的三元组数据集, 作为第二类三元组数据集; 所述第一类三元组数据集和所述第二类三元组数据集, 输入到不同的语义识别模型 中, 输出所述第一类三元组数据集和所述第二类三元组数据集的关系预测分数; 将所述第一类三元组数据集合集的关系预测分数, 与 所述第二类三元组数据集的关系 预测分数融合, 输出关系预测结果。 2.根据权利要求1所述的方法, 其特征在于, 所述第 一类三元组数据集包括英文名语义 数据和中文名语义数据; 所述第二类三元组数据集包括描述数据和 属性数据。 3.根据权利要求2所述的方法, 其特征在于, 以所述第 一类三元组数据集中的中文名语 义数据, 与电网公共数据模型的实体文件进行匹配, 提取 所述第二类三元组数据集。 4.根据权利要求2所述的方法, 其特征在于, 所述英文名语义数据、 中文名语义数据、 描 述数据和 属性数据分别输入到不同的语义识别模型中, 分别输出: 对应英文名语义数据的多种关系类型的预测分数、 对应中文名语义数据的多种关系类 型的预测分数、 对应描述数据的多种关系类型的预测分数和对应属性数据的多种关系类型 的预测分数。 5.根据权利要求4所述的方法, 其特征在于, 将得到的所述英文名语义数据、 中文名语 义数据、 描述数据和属 性数据的多种关系类型 的预测分数进行加权融合, 输出多种关系类 型的预测结果。 6.根据权利要求5所述的方法, 其特征在于, 从输出的多种关系类型的预测结果中, 选 取概率值最大的关系类型作为 最终的关系预测结果。 7.一种适于并列型关系的实体关系预测的方法, 其特 征在于, 所述方法包括: 获取电网公共数据模型的实体文件, 将所有存在一对一关系的若干头实体和若干尾实 体作为项集, 其中, 每一个实体为所述项集中的一项, 计算每一个项集内的不同实体的支持度概 率, 以及不同实体的置信度概 率, 以及 计算相连项集之间, 相连实体的支持度概 率, 以及相连实体的置信度概 率; 通过所述支持度概 率和所述置信度概 率, 判断两项实体之间存在关系的可能性, 使用权利要求1至6中的任一权利要求所述的方法对可能存在关系的实体进行关系预 测。 8.根据权利要求7所述的方法, 其特征在于, 计算项集内的头实体与尾实体的支持度概 率和置信度概 率, 当某一头实体和某一尾实体的支持度概率和置信度概率均大于预设阈值, 则该头实体 和尾实体可能存在关系; 计算相连项集之间, 相连的不同实体的支持度概 率和置信度概 率; 当不同项集中相连的实体的支持度概率和置信度概率大于预设阈值, 则, 则相连的实 体可能存在关系。权 利 要 求 书 1/3 页 2 CN 115204179 A 29.一种适于继承型关系的实体关系预测的方法, 其特 征在于, 所述方法包括: 获取电网公共数据模型的实体文件, 筛选存在一对多关系的实体作为第 一项集, 其中, 以尾实体为第一父实体, 头实体为第一子实体; 获取电网公共数据模型的实体文件, 剔除所述第一项集内的每一项实体, 将剩下的实 体作为第二项集; 选取第二项集中与第一项集中的第一子实体相似的实体, 作为第二子实体, 并且, 将与第二项集中相似实体的第一子实体对应的第一父实体, 作为第二父实体, 使用权利要求1至6中的任一权利要求所述的方法对第二子实体与第二父实体进行关 系预测。 10.根据权利要求9所述的方法, 其特征在于, 通过编 辑距离或者语义距离, 判断第 二项 集中的每一项实体与第一项集中的第一子实体之间的相似性。 11.一种基于电网公共数据模型的实体关系预测的装置, 其特 征在于, 所述装置包括: 文件获取模块, 用于获取电网公共数据模型的实体文件和关系文件; 数据提取模块, 用于以头实体语义信息和尾实体语义信息作为输入, 关系类别作为输 出, 生成的三元组数据集, 作为第一类三元组数据集; 将所述第一类三元组数据集, 与所述电网公共数据模型的实体文件进行匹配, 提取匹 配的三元组数据集, 作为第二类三元组数据集; 语义识别模块, 用于将所述第一类三元组数据集和所述第二类三元组数据集, 输入到 不同的语义识别模型中, 输出所述第一类三元组数据集和所述第二类三元组数据集的关系 预测分数; 关系预测模块, 用于将所述第一类三元组数据集合集的关系预测分数, 与所述第二类 三元组数据集的关系预测分数融合, 输出关系预测结果。 12.根据权利要求11所述的装置, 其特征在于, 所述第 一类三元组数据集包括英文名语 义数据和中文名语义数据; 所述第二类三元组数据集包括描述数据和 属性数据。 13.根据权利要求12所述的装置, 其特征在于, 以所述第 一类三元组数据集中的中文名 语义数据, 与电网公共数据模型的实体文件进行匹配, 提取 所述第二类三元组数据集。 14.根据权利要求12所述的装置, 其特征在于, 所述英文名语义数据、 中文名语义数据、 描述数据和 属性数据分别输入到不同的语义识别模型中, 分别输出: 对应英文名语义数据的多种关系类型的预测分数、 对应中文名语义数据的多种关系类 型的预测分数、 对应描述数据的多种关系类型的预测分数和对应属性数据的多种关系类型 的预测分数。 15.根据权利要求14所述的装置, 其特征在于, 将得到的所述英文名语义数据、 中文名 语义数据、 描述数据和属 性数据的多种关系类型 的预测分数进行加权融合, 输出多种关系 类型的预测结果。 16.根据权利要求15所述的装置, 其特征在于, 从输出的多种关系类型的预测结果中, 选取概率值最大的关系类型作为 最终的关系预测结果。 17.一种适于并列型关系的实体关系预测的装置, 其特 征在于, 所述装置包括: 第一文件获取模块, 用于获取电网公共数据模型的实体文件, 将所有存在一对一关系权 利 要 求 书 2/3 页 3 CN 115204179 A 3

.PDF文档 专利 基于电网公共数据模型的实体关系预测的方法及装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于电网公共数据模型的实体关系预测的方法及装置 第 1 页 专利 基于电网公共数据模型的实体关系预测的方法及装置 第 2 页 专利 基于电网公共数据模型的实体关系预测的方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。