说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210304638.9 (22)申请日 2022.03.21 (71)申请人 浙江大华 技术股份有限公司 地址 310053 浙江省杭州市滨江区滨安路 1187号 (72)发明人 范鹏召 刘伟棠 陈立力 周明伟  钱佳佳 郑燕玲  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 杜晶 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01) (54)发明名称 一种属性三元组合并方法、 装置、 设备及介 质 (57)摘要 本申请实施例提供了一种属性三元组合并 方法、 装置、 设备及介质, 针对任一属性三元组, 在该原始文本中标识该属性三元组分别对应的 属性值; 并标识任一第一其他属性三元组的属性 值; 将标识了两个属性值的原始文本输入到训练 完成的合并模 型中, 获取该合并模 型输出的该两 个属性值的相似度; 根据该相似度和/或该属性 三元组及所述第一其他属性三元组属于同一实 体的目标属性三元组的目标相似度, 确定该属性 三元组与所述第一其他属性三元组是否属于同 一个实体, 从而提高了属性三元组合并的准确 率。 权利要求书2页 说明书15页 附图4页 CN 114691887 A 2022.07.01 CN 114691887 A 1.一种属性 三元组合并方法, 其特 征在于, 所述方法包括: 识别原始文本中的每个属性三元组; 针对任一属性三元组, 在所述原始文本中标识该 属性三元组对应的属 性值; 并标识任一第一其他属 性三元组的属 性值; 将标识了两个属 性 值的原始文本输入到训练完成的合并模型中, 获取所述合并模型输出的所述两个属性值的 相似度; 根据所述相似度和/或与 该属性三元组及所述第 一其他属性三元组属于同一实体的目 标属性三元组的目标相似度, 确定该属性三元组与所述第一其他属性三元组是否属于同一 实体; 针对任一属性三元组, 识别与该属性三元组属于同一实体的第二其他属性三元组, 将 该属性三元组与所述第二 其他属性三元组进行合并。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述相似度, 确定该属性三元组 与所述第一 其他属性三元组是否属于同一实体包括: 若所述相似度超过预设的阈值, 则确定该属性三元组与 所述第一其他属性三元组属于 同一实体。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述相似度和与 该属性三元组及 所述第一其他属性三元组属于同一实体的目标属性三元组的目标相似度, 确定该属性三元 组与所述第一 其他属性三元组是否属于同一实体包括: 若所述相似度 未超过预设的阈值, 根据所述目标属性三元组与 该属性三元组 的目标相 似度, 及所述 目标属性三元组与所述第一其他属 性三元组的目标相似度, 确定所述 目标相 似度的平均值; 若所述平均值大于预设数值与所述相似度的差值, 则确定该属性三元组与 所述第一其 他属性三元组属于同一实体。 4.根据权利要求1所述的方法, 其特征在于, 若确定该属性三元组与 所述第一其他属性 三元组属于同一实体之后, 所述针对任一属 性三元组, 识别与该属 性三元组属于同一实体 的第二其他属性三元组之前, 所述方法还 包括: 在保存有每种属性对应的属性值的知识图谱的数据库中, 查询该两个属性值是否属于 同一属性; 若该两个属性值不属于同一属性, 进行后续的针对任一属性三元组, 识别与该属性三 元组属于同一实体的第二 其他属性三元组的步骤。 5.根据权利要求1所述的方法, 其特征在于, 所述将标识了两个属性值的原始文本输入 到训练完成的合并模型中, 获取 所述合并模型输出的所述两个属性 值的相似度包括: 将所述标识了两个属性值的原始文本输入到所述合并模型的第 一子模型中, 接收所述 第一子模型输出的标识有每 个字的字向量以及该两个属性 值的第一文本; 将所述第一文本输入到所述合并模型的第 二子模型中, 接收所述第 二子模型输出的标 识有每个字对应的更新后的字向量以及该两个属性值的第二文本, 其中每个更新后的字向 量中携带有所述第一文本的语义特 征信息; 将所述第二文本输入到所述合并模型的第 三子模型中, 接收所述第 三子模型输出的所 述相似度。 6.根据权利要求1所述的方法, 其特 征在于, 所述 合并模型的训练过程包括:权 利 要 求 书 1/2 页 2 CN 114691887 A 2将标识有两个属性值以及该两个属性值的第一样本相似度的样本原始文本输入到所 述合并模型中, 接收所述 合并模型输出的所述两个属性 值的第二样本相似度; 根据所述第一样本相似度和所述第二样本相似度, 对所述 合并模型的参数进行调整。 7.一种属性 三元组合并装置, 其特 征在于, 所述装置包括: 处理模块, 用于识别原始文本 中的每个属性三元组; 针对任一属性三元组, 在所述原始 文本中标识该属 性三元组对应的属 性值; 并标识任一第一其他属 性三元组的属 性值; 将标 识了两个属性值的原始文本输入到训练完成的合并模型中, 获取所述合并模型输出的所述 两个属性 值的相似度; 确定模块, 用于根据所述相似度和/或与该属性三元组及所述第一其他属性三元组属 于同一实体的目标属性三元组的目标相似度, 确定该属性三元组与所述第一其他属性三元 组是否属于同一实体; 合并模块, 用于针对任一属性三元组, 识别与该属性三元组属于同一实体的第二其他 属性三元组, 将该属性 三元组与所述第二 其他属性三元组进行合并。 8.根据权利要求7所述的装置, 其特征在于, 所述确定模块, 具体用于若所述相似度超 过预设的阈值, 则确定该属性 三元组与所述第一 其他属性三元组属于同一实体。 9.根据权利要求7所述的装置, 其特征在于, 所述确定模块, 具体用于若所述相似度未 超过预设的阈值, 根据所述 目标属性三元组与该属 性三元组的目标相似度, 及所述 目标属 性三元组与所述第一其他属 性三元组的目标相似度, 确定所述 目标相似度的平均值; 若所 述平均值大于预设数值与所述相似度的差值, 则确定该属性三元组与所述第一其他属性三 元组属于同一实体。 10.根据权利要求7所述的装置, 其特征在于, 所述确定模块, 还用于在保存有每种属性 对应的属 性值的知识图谱的数据库中, 查询该两个属 性值是否属于同一属 性; 若该两个属 性值不属于同一属 性, 进行后续的针对任一属 性三元组, 识别与该属 性三元组属于同一实 体的第二 其他属性三元组的步骤。 11.根据权利要求7所述的装置, 其特征在于, 所述处理模块, 具体用于将所述标识了两 个属性值的原始文本输入到所述合并模型的第一子模型中, 接收所述第一子模型输出的标 识有每个字的字向量以及该两个属性值的第一文本; 将所述第一文本输入到所述合并模型 的第二子模型中, 接收所述第二子模型输出的标识有每个字对应的更新后的字向量以及该 两个属性值的第二文本, 其中每个更新后的字向量中携带有所述第一文本的语义特征信 息; 将所述第二文本输入到所述合并模型 的第三子模型中, 接 收所述第三子模型输出 的所 述相似度。 12.根据权利要求7 所述的装置, 其特 征在于, 所述装置还 包括: 训练模块, 用于将标识有两个属性值以及该两个属性值的第 一样本相似度的样本原始 文本输入到所述合并模型中, 接收所述合并模型输出的所述两个属性值的第二样本相似 度; 根据所述第一样本相似度和所述第二样本相似度, 对所述 合并模型的参数进行调整。 13.一种电子设备, 其特征在于, 所述电子设备包括处理器, 所述处理器用于执行存储 器中存储的计算机程序时实现如权利要求1 ‑6中任一所述属性 三元组合并方法的步骤。 14.一种计算机可读存储介质, 其特征在于, 其存储有计算机程序, 所述计算机程序被 处理器执行时实现如权利要求1 ‑6中任一所述属性 三元组合并方法的步骤。权 利 要 求 书 2/2 页 3 CN 114691887 A 3

.PDF文档 专利 一种属性三元组合并方法、装置、设备及介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种属性三元组合并方法、装置、设备及介质 第 1 页 专利 一种属性三元组合并方法、装置、设备及介质 第 2 页 专利 一种属性三元组合并方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。