说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211064239.6 (22)申请日 2022.09.01 (65)同一申请的已公布的文献号 申请公布号 CN 115130623 A (43)申请公布日 2022.09.30 (73)专利权人 浪潮通信 信息系统有限公司 地址 250101 山东省济南市高新区浪潮路 1036号浪潮科技园S0 6号楼 (72)发明人 陈小超  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 苗青盛 (51)Int.Cl. G06K 9/62(2022.01) G06Q 30/02(2012.01)(56)对比文件 CN 114880923 A,202 2.08.09 CN 110069932 A,2019.07.3 0 审查员 刘莎莎 (54)发明名称 数据融合方法、 装置、 电子设备及存 储介质 (57)摘要 本发明提供一种数据融合方法、 装置、 电子 设备及存储介质, 涉及计算机技术领域, 该方法 包括: 将目标用户的多个原始评估 结果输入数据 融合模型, 获取数据融合模型输出的目标用户的 评估结果; 其中, 各原始评估结果基于目标用户 在不同目标数据源中的用户数据获得, 每一原始 评估结果与每一目标数据源具有一一对应关系; 数据融合模型基于样本用户在每一目标数据源 中的用户数据获得。 本发明提供的数据融合方 法、 装置、 电子设备及存储介质, 能解决因数据安 全、 网络策略、 数据一致性以及相关口径差异等 因素造成的数据融合问题, 能更准确、 更高效的 融合来自不同数据源的数据, 能提高用户画像的 准确率和效率, 能为商业活动策划及营销决策提 供辅助支持。 权利要求书3页 说明书16页 附图3页 CN 115130623 B 2022.11.25 CN 115130623 B 1.一种数据融合方法, 其特 征在于, 包括: 获取目标用户的多个原 始评估结果; 将各所述原始评估结果输入数据融合模型, 获取所述数据融合模型输出的所述目标用 户的评估结果; 其中, 各所述原始评估结果基于所述目标用户在不同目标数据源中的用户数据获得, 每一所述原始评估结果与每一所述目标数据源具有一一对应关系; 所述数据融合模型基于 样本用户在每一所述目标 数据源中的用户数据获得; 所述数据融合模型, 包括: 数据脱敏 单元、 权重计算单 元和数据融合单 元; 相应地, 所述将各所述原始评估结果输入数据融合模型, 获取所述数据融合模型输出 的所述目标用户的评估结果, 包括: 获取权重计算单元输出的每一所述目标数据源对应的权重值, 并将各所述原始评估结 果输入所述数据脱敏单元, 获取所述数据脱敏单元输出的每一所述原始评估结果对应的目 标WOE值; 将各所述权重值和各所述目标WOE值输入所述数据融合单元, 获取所述数据融合单元 输出的所述目标用户的评估结果; 其中, 所述权重计算单元是基于Stacking框架构建, 基于样本用户在每一所述目标数 据源中的用户数据训练得到的。 2.根据权利要求1所述的数据融合方法, 其特征在于, 所述数据脱敏单元, 包括: 结果分 组子单元和数据脱敏子单 元; 相应地, 所述将各所述原始评估结果输入所述数据脱敏单元, 获取所述数据脱敏单元 输出的每一所述原 始评估结果对应的目标WOE值, 包括: 将各所述原始评估结果输入所述结果分组子单元, 由所述结果分组子单元确定每一原 始评估结果所在的预设数值区间, 并基于预设数值区间与分组标识之间的对应关系, 确定 所述每一原始评估结果对应的目标分组标识, 进而获取所述结果分组子单元输出的每一所 述目标分组标识; 将各所述目标分组标识输入所述数据脱敏子单元, 由所述数据脱敏子单元基于分组标 识与WOE值之间的对应关系, 确定每一所述目标分组标识对应的目标WOE值, 进而获取所述 数据脱敏子单 元输出的每一所述目标WOE值; 其中, 所述预设数值区间、 分组标识以及WOE值之间的对应关系, 基于所述样本用户在 每一所述目标 数据源中的用户数据确定 。 3.根据权利要求1所述的数据融合方法, 其特征在于, 所述数据融合单元, 包括: 第一数 值计算子单 元和第二数值计算子单 元; 相应地, 所述将各所述权重值和各所述目标WOE值输入所述数据融合单元, 获取所述数 据融合单 元输出的所述目标用户的评估结果, 包括: 将各所述权重值和各所述WOE值输入所述第一数值计算子单元, 由所述第一数值计算 子单元获取每一目标数据源对应的权重值与所述每一目标数据源对应的目标WOE值的乘 积, 作为所述 目标用户的每一中间评估结果, 进而获取所述第一数值计算子单元输出 的每 一所述中间评估结果; 将各所述中间评估结果输入所述第 二数值计算子单元, 由所述第 二数值计算子单元获权 利 要 求 书 1/3 页 2 CN 115130623 B 2取各所述中间评估结果之和, 作为所述 目标用户的评估结果, 进而获取所述第二数值计算 子单元输入的所述目标用户的评估结果。 4.根据权利要求2所述的数据融合方法, 其特征在于, 在所述目标用户的数量为多个的 情况下, 所述将各所述原始评估结果输入数据融合模型, 获取所述数据融合模型输出 的所 述目标用户的评估结果之后, 还 包括: 确定每一目标用户的评估结果所在的预设数值区间, 并基于预设数值 区间与分组标识 之间的对应关系, 确定所述每一目标用户对应的分组标识; 统计每一分组标识对应的目标用户的数量, 在任一分组标识对应的目标用户的数量不 小于第一预设值的情况下, 基于各所述 目标用户的评估结果, 将至少一个所述目标用户确 定为测试用户; 对所述测试用户进行外呼测试, 获取 所述测试用户的外呼测试 结果。 5.根据权利要求4所述的数据融合方法, 其特征在于, 所述获取所述测试用户的外呼测 试结果之后, 还 包括: 在满足预设条件的情况下, 基于所述测试用户的外呼测试结果, 更新所述数据融合模 型。 6.根据权利要求5所述的数据融合方法, 其特征在于, 所述在满足预设条件的情况下, 基于所述测试用户的外呼测试 结果, 更新所述数据融合模型, 包括: 在任一分组标识对应的目标用户的数量占所述目标用户总数的占比大于第 二预设值, 且所述任一分组标识对应的测试用户的数量大于第三预设值的情况下, 基于所述测试用户 的外呼测试 结果, 更新所述任一分组标识对应的目标WOE值。 7.一种数据融合装置, 其特 征在于, 包括: 数据获取模块, 用于获取目标用户的多个原 始评估结果; 数据融合模块, 用于将各所述原始评估结果输入数据融合模型, 获取所述数据融合模 型输出的所述目标用户的评估结果; 其中, 各所述原始评估结果基于所述目标用户在不同目标数据源中的用户数据获得, 每一所述原始评估结果与每一所述目标数据源具有一一对应关系; 所述数据融合模型基于 样本用户在每一所述目标 数据源中的用户数据获得; 所述数据融合模型, 包括: 数据脱敏 单元、 权重计算单 元和数据融合单 元; 相应地, 所述将各所述原始评估结果输入数据融合模型, 获取所述数据融合模型输出 的所述目标用户的评估结果, 包括: 获取权重计算单元输出的每一所述目标数据源对应的权重值, 并将各所述原始评估结 果输入所述数据脱敏单元, 获取所述数据脱敏单元输出的每一所述原始评估结果对应的目 标WOE值; 将各所述权重值和各所述目标WOE值输入所述数据融合单元, 获取所述数据融合单元 输出的所述目标用户的评估结果; 其中, 所述权重计算单元是基于Stacking框架构建, 基于样本用户在每一所述目标数 据源中的用户数据训练得到的。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所权 利 要 求 书 2/3 页 3 CN 115130623 B 3

.PDF文档 专利 数据融合方法、装置、电子设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据融合方法、装置、电子设备及存储介质 第 1 页 专利 数据融合方法、装置、电子设备及存储介质 第 2 页 专利 数据融合方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:32:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。