专利数据融合方法、装置、电子设备及存储介质

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202211064239.6 (22)申请日 2022.09.01 (65)同一申请的已公布的文献号申请公布号 CN 115130623 A (43)申请公布日 2022.09.30 (73)专利权人浪潮通信信息系统有限公司地址 250101 山东省济南市高新区浪潮路 1036号浪潮科技园S0 6号楼 (72)发明人陈小超　 (74)专利代理机构北京路浩知识产权代理有限公司 11002 专利代理师苗青盛 (51)Int.Cl. G06K 9/62(2022.01) G06Q 30/02(2012.01)(56)对比文件 CN 114880923 A,202 2.08.09 CN 110069932 A,2019.07.3 0 审查员刘莎莎 (54)发明名称数据融合方法、装置、电子设备及存储介质 (57)摘要本发明提供一种数据融合方法、装置、电子设备及存储介质，涉及计算机技术领域，该方法包括：将目标用户的多个原始评估结果输入数据融合模型，获取数据融合模型输出的目标用户的评估结果；其中，各原始评估结果基于目标用户在不同目标数据源中的用户数据获得，每一原始评估结果与每一目标数据源具有一一对应关系；数据融合模型基于样本用户在每一目标数据源中的用户数据获得。本发明提供的数据融合方法、装置、电子设备及存储介质，能解决因数据安全、网络策略、数据一致性以及相关口径差异等因素造成的数据融合问题，能更准确、更高效的融合来自不同数据源的数据，能提高用户画像的准确率和效率，能为商业活动策划及营销决策提供辅助支持。权利要求书3页说明书16页附图3页 CN 115130623 B 2022.11.25 CN 115130623 B 1.一种数据融合方法，其特征在于，包括：获取目标用户的多个原始评估结果；将各所述原始评估结果输入数据融合模型，获取所述数据融合模型输出的所述目标用户的评估结果；其中，各所述原始评估结果基于所述目标用户在不同目标数据源中的用户数据获得，每一所述原始评估结果与每一所述目标数据源具有一一对应关系；所述数据融合模型基于样本用户在每一所述目标数据源中的用户数据获得；所述数据融合模型，包括：数据脱敏单元、权重计算单元和数据融合单元；相应地，所述将各所述原始评估结果输入数据融合模型，获取所述数据融合模型输出的所述目标用户的评估结果，包括：获取权重计算单元输出的每一所述目标数据源对应的权重值，并将各所述原始评估结果输入所述数据脱敏单元，获取所述数据脱敏单元输出的每一所述原始评估结果对应的目标WOE值；将各所述权重值和各所述目标WOE值输入所述数据融合单元，获取所述数据融合单元输出的所述目标用户的评估结果；其中，所述权重计算单元是基于Stacking框架构建，基于样本用户在每一所述目标数据源中的用户数据训练得到的。 2.根据权利要求1所述的数据融合方法，其特征在于，所述数据脱敏单元，包括：结果分组子单元和数据脱敏子单元；相应地，所述将各所述原始评估结果输入所述数据脱敏单元，获取所述数据脱敏单元输出的每一所述原始评估结果对应的目标WOE值，包括：将各所述原始评估结果输入所述结果分组子单元，由所述结果分组子单元确定每一原始评估结果所在的预设数值区间，并基于预设数值区间与分组标识之间的对应关系，确定所述每一原始评估结果对应的目标分组标识，进而获取所述结果分组子单元输出的每一所述目标分组标识；将各所述目标分组标识输入所述数据脱敏子单元，由所述数据脱敏子单元基于分组标识与WOE值之间的对应关系，确定每一所述目标分组标识对应的目标WOE值，进而获取所述数据脱敏子单元输出的每一所述目标WOE值；其中，所述预设数值区间、分组标识以及WOE值之间的对应关系，基于所述样本用户在每一所述目标数据源中的用户数据确定。 3.根据权利要求1所述的数据融合方法，其特征在于，所述数据融合单元，包括：第一数值计算子单元和第二数值计算子单元；相应地，所述将各所述权重值和各所述目标WOE值输入所述数据融合单元，获取所述数据融合单元输出的所述目标用户的评估结果，包括：将各所述权重值和各所述WOE值输入所述第一数值计算子单元，由所述第一数值计算子单元获取每一目标数据源对应的权重值与所述每一目标数据源对应的目标WOE值的乘积，作为所述目标用户的每一中间评估结果，进而获取所述第一数值计算子单元输出的每一所述中间评估结果；将各所述中间评估结果输入所述第二数值计算子单元，由所述第二数值计算子单元获权　利　要　求　书 1/3 页 2 CN 115130623 B 2取各所述中间评估结果之和，作为所述目标用户的评估结果，进而获取所述第二数值计算子单元输入的所述目标用户的评估结果。 4.根据权利要求2所述的数据融合方法，其特征在于，在所述目标用户的数量为多个的情况下，所述将各所述原始评估结果输入数据融合模型，获取所述数据融合模型输出的所述目标用户的评估结果之后，还包括：确定每一目标用户的评估结果所在的预设数值区间，并基于预设数值区间与分组标识之间的对应关系，确定所述每一目标用户对应的分组标识；统计每一分组标识对应的目标用户的数量，在任一分组标识对应的目标用户的数量不小于第一预设值的情况下，基于各所述目标用户的评估结果，将至少一个所述目标用户确定为测试用户；对所述测试用户进行外呼测试，获取所述测试用户的外呼测试结果。 5.根据权利要求4所述的数据融合方法，其特征在于，所述获取所述测试用户的外呼测试结果之后，还包括：在满足预设条件的情况下，基于所述测试用户的外呼测试结果，更新所述数据融合模型。 6.根据权利要求5所述的数据融合方法，其特征在于，所述在满足预设条件的情况下，基于所述测试用户的外呼测试结果，更新所述数据融合模型，包括：在任一分组标识对应的目标用户的数量占所述目标用户总数的占比大于第二预设值，且所述任一分组标识对应的测试用户的数量大于第三预设值的情况下，基于所述测试用户的外呼测试结果，更新所述任一分组标识对应的目标WOE值。 7.一种数据融合装置，其特征在于，包括：数据获取模块，用于获取目标用户的多个原始评估结果；数据融合模块，用于将各所述原始评估结果输入数据融合模型，获取所述数据融合模型输出的所述目标用户的评估结果；其中，各所述原始评估结果基于所述目标用户在不同目标数据源中的用户数据获得，每一所述原始评估结果与每一所述目标数据源具有一一对应关系；所述数据融合模型基于样本用户在每一所述目标数据源中的用户数据获得；所述数据融合模型，包括：数据脱敏单元、权重计算单元和数据融合单元；相应地，所述将各所述原始评估结果输入数据融合模型，获取所述数据融合模型输出的所述目标用户的评估结果，包括：获取权重计算单元输出的每一所述目标数据源对应的权重值，并将各所述原始评估结果输入所述数据脱敏单元，获取所述数据脱敏单元输出的每一所述原始评估结果对应的目标WOE值；将各所述权重值和各所述目标WOE值输入所述数据融合单元，获取所述数据融合单元输出的所述目标用户的评估结果；其中，所述权重计算单元是基于Stacking框架构建，基于样本用户在每一所述目标数据源中的用户数据训练得到的。 8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所权　利　要　求　书 2/3 页 3 CN 115130623 B 3

专利 数据融合方法、装置、电子设备及存储介质

专利数据融合方法、装置、电子设备及存储介质