说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210152572.6 (22)申请日 2022.02.18 (71)申请人 深圳前海微众 银行股份有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 李烨薇  (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 专利代理师 王花丽 张颖玲 (51)Int.Cl. G06F 16/36(2019.01) (54)发明名称 一种数据处 理方法、 装置、 设备及存 储介质 (57)摘要 本申请公开了一种数据处理方法、 装置、 设 备及存储介质, 所述方法包括: 对于本申请的方 案, 基于数据库包括的至少两个数据模型以及数 据模型之间的上下游关系, 建立第一关系图谱; 所述第一关系图谱包括至少两个节点 以及至少 一个有向边; 基于所述至少两个节 点以及所述至 少一个有向边, 确定所述第一关系图谱中的第一 核心节点; 对 所述第一核心节 点指向的数据模型 进行比对, 得到针对所述数据库的第一比对结 果; 基于所述第一比对结果, 得到针对所述数据 库的目标比对结果。 本申请的方案在进行比对 时, 可以同时具有自动化程度高、 准确率高、 数据 处理量小、 比对效率高的特点。 权利要求书3页 说明书22页 附图5页 CN 114741520 A 2022.07.12 CN 114741520 A 1.一种数据处 理方法, 其特 征在于, 所述方法包括: 基于数据库包括的至少两个数据模型以及数据模型之间的上下游关系, 建立第 一关系 图谱; 所述第一关系图谱包括至少 两个节点以及至少一个有向边; 一个所述节点用于唯一 指向所述至少两个数据模型中一个所述数据模型, 一个所述有向边通过第一节点指向第二 节点, 所述有向边用于表征 所述第一节点 为所述第二节点的上游 节点; 基于所述至少两个节点以及所述至少一个有向边, 确定所述第 一关系图谱中的第 一核 心节点; 所述第一核心 节点为所述第一关系图谱中重要性满足第一条件的节点; 对所述第一核心节点指向的数据模型进行比对, 得到针对所述数据库的第一 比对结 果; 所述比对用于判断第一核心节点指向的数据模型在第一状态和第二状态下的内容是否 相同; 基于所述第一比对结果, 得到针对所述数据库的目标比对结果; 在所述目标比对结果 中, 每个所述数据模型的子比对结果 为内容相同或内容 不同。 2.根据权利要求1所述的方法, 其特征在于, 所述基于数据库包括的至少两个数据模型 以及数据模型之间的上 下游关系, 建立第一关系图谱, 包括: 针对所述至少两个数据模型中的每个数据模型建立指向所述数据模型的节点, 得到所 述至少两个节点; 针对所述数据模型之间的上下游关系, 建立所述第一节点指向所述第二节点的有向 边, 得到所述至少一个有向边; 所述第一节点用于指向所述第一数据模型, 所述第二节点用 于指向所述第二数据模型; 所述上下游关系用于表征所述第二数据模型中的第一数据是根 据所述第一数据模型 得到的; 至少根据所述至少两个节点、 以及所述至少一个有向边得到所述第一关系图谱。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述至少两个节点以及所述至少 一个有向边, 确定所述第一关系图谱中的第一核心 节点, 包括: 基于所述至少两个节点以及所述至少一个有向边, 确定所述至少两个节点中每个所述 节点的度数中心 性; 所述度数中心 性用于表征在所述第一关系图谱中所述节点的下游节点 的数量; 基于所述至少两个节点以及所述至少一个有向边, 确定所述至少两个节点中每个所述 节点的介数中心 性; 所述介数中心 性用于表征所述节点出现在所述第一关系图谱的最短路 径上的次数; 确定所述至少两个节点中每个所述节点的重要性; 所述节点的重要性与所述节点的度 数中心性和所述节点的介数中心性相关; 将所述至少两个节点中, 重要性满足所述第一条件的节点确定为所述第一核心 节点。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述至少两个节点以及所述至少 一个有向边, 确定所述至少两个节点中每 个所述节点的度数中心性, 包括: 针对每个所述节点, 根据第一公式计算所述节点的度中心性; 其中, 所述第一公式包括 (i≠j); 所述ti表示所述节点; 所述CD (ti)表示所述节点的度中心性; 所述tj为所述ti的下游节点; 所述xij表示存在ti指向tj的有权 利 要 求 书 1/3 页 2 CN 114741520 A 2向边。 5.根据权利要求3所述的方法, 其特征在于, 所述基于所述至少两个节点以及所述至少 一个有向边, 确定所述至少两个节点中每 个所述节点的介数中心性, 包括: 针对每个所述节点, 根据第二公式计算所述节点的介数中心性; 所述第二公式包括 (j≠k); 所述ti表示所述节点; 所述 tj、 所述tk为所述至少两个节点中除所述ti之外的节点; 所述CB(ti)表示所述节点的介数中 心性, 所述p(j, i, k)表示所述ti处于所述tj到所述tk的最短路径上的数量, 所述 表示在所述第一关系图谱中所述tj到所述tk的所有最短路径的数量。 6.根据权利要求3所述的方法, 其特征在于, 所述确定所述至少两个节点中每个所述节 点的重要性, 包括: 针对每个所述节点, 根据第三公式计算所述节点的重要性; 所述第三公式包 括: 所述ti表示所述节点; 所述 TI(ti)表示所述节点的重要性; 所述CB(ti)表示所述节点的介 数中心性; 所述 表示所 述第一关系图谱中的所有节点 的介数中心性 的均值, 所述sd(CB(t))表示所述第一关系图 谱中的所有节点的介数中心性的标准差; 所述CU(ti)表示所述节点的度数中心性; 所述 表示所述第一关系图谱中的所有节点的度数中心性的均值; 所述sd(CU(t))表示所述 第一关系图谱中的所有节点的度数中心性的标准差 。 7.根据权利要求1所述的方法, 其特征在于, 所述对所述第 一核心节点指向的数据模型 进行比对, 得到针对所述数据库的第一比对结果, 包括: 对所述第一核心 节点指向的数据模型进行比对, 得到第一子比对结果; 若所述第一子比对结果为内容相同, 基于所述第一子比对结果, 更新所述第一关系图 谱中, 所述第一核心节点的上游节点指向的数据模型 的子比对结果, 得到所述第一比对结 果; 若所述第 一子比对结果为内容不同, 获取不同字段, 并将所述第一关系图谱中, 所述第 一核心节点的下游节点中与所述不同字段相关的节点所指向的数据模型的子比对结果更 新为内容不同, 得到所述第一比对结果。 8.根据权利要求1所述的方法, 其特征在于, 所述基于所述第一比对结果, 得到针对所 述数据库的目标比对结果, 包括: 判断所述第一比对结果中是否满足每个所述数据模型的子比对结果为内容相同或内 容不同; 若所述第一比对结果中不能满足每个所述数据模型的子比对结果为内容相同或内容 不同; 基于所述第一核心 节点确定第二关系图谱; 确定所述第 二关系图谱中的第 二核心节点, 并对所述第 二核心节点指向的数据模型进权 利 要 求 书 2/3 页 3 CN 114741520 A 3

.PDF文档 专利 一种数据处理方法、装置、设备及存储介质

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法、装置、设备及存储介质 第 1 页 专利 一种数据处理方法、装置、设备及存储介质 第 2 页 专利 一种数据处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。