(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210968212.3
(22)申请日 2022.08.12
(71)申请人 太保科技有限公司
地址 200010 上海市黄浦区中山 南路1号1 1
层(名义楼层)1 1V6室
(72)发明人 史春奇 罗松 隋光烨 吴顺洁
李沛燃 李苑
(74)专利代理 机构 上海专利商标事务所有限公
司 31100
专利代理师 骆希聪
(51)Int.Cl.
G06N 20/00(2019.01)
G06N 3/08(2006.01)
(54)发明名称
纵向联邦学习可解释性控制方法、 装置及处
理系统
(57)摘要
本发明提供一种纵向联邦学习可解释性控
制方法, 用于跨数据源隐私数据合作的建模效果
评估与数据贡献分析, 包括如下步骤: a确定 数据
源A的抽样数据XA={X1A,...,XnA}以及验证数据
At, 确定数据源B的抽样数据XB={X1B,...,XnB}
以及验证数据Bt,其中XiA=[xAi1,...,xAiK1],XiB
=[xBi1,...,xBiK2]; b应用神经网络模型对上述
抽样数据进行预测; c通过神经网络模型对上述
抽样数据进行预测; 按照数据源A效果权重WA,和
数据源B效果权重WB分别对数据源A的K1个特征
的局部贡献度与数据源B的K2 个特征的局部贡献
度进行加权。 还提供对应的控制装置、 处理系统。
可以实现多个企业之间数据的综合评价。
权利要求书2页 说明书7页 附图6页
CN 115271100 A
2022.11.01
CN 115271100 A
1.一种纵向联邦学习可解释性控制方法, 用于跨数据源隐私数据合作的建模效果评估
与数据贡献分析, 其特 征在于, 包括如下步骤:
a.确定数据源A的抽样数据XA={X1A,...,XnA}以及验证数据At, 确 定数据源B的抽样数
据XB={X1B,...,XnB}以及验证数据Bt,其中XiA=[xAi1,...,xAiK1],XiB=[xBi1,...,xBiK2], 所
述数据源A 表示为[xA1,...,xAK1],数据源B表示 为[xB1,...,xBK2];
b.应用神经网络模型对上述抽样数据进行预测, 并通过局部模型方式进行效果预测,
并计算数据源A的效果权重WA=ACCA/(ACCA+ACCB)、 数据源B的效果权重WB=ACCB/(ACCA+
ACCB), 其中, AC CA为数据源A的局部模型效果、 AC CB为数据源A的局部模型效果;
c.通过神经网络模型对上述抽样数据进行预测, 得到预测结果Y={y1,...,yn}, 联合XA
={X1A,...,XnA}与Y={y1,...,yn}训练局部线性模型LineModelA, 并通过LineModelA获得数
据源A的K1个特征的局部贡献度FWA=[fwA1,...,fwAK1]; 联合XB={X1B,...,XnB}与Y=
{y1,...,yn}训练局部线性模型LineModelB, 并通过LineModelB分析数据源B的K2个特征的
局部贡献度FWB=[fwB1,...,fwBK2];
d.按照数据 源A效果权重WA,和数据源B效果权重WB分别对数据 源A的K1个特征的局部贡
献度与数据源B的K2个特征的局 部贡献度进行加权, 得到WFWA=WA*FWA=[WA*fwA1,...,WA*
fwAK1]、 WFWB=WB*FWB=[WB*fwB1,...,WB*fwBK2]。
2.根据权利要求1所述的方法, 其特 征在于, 还 包括步骤:
e.对数据 源A的效果权重WA,和数据源B的效果权重WB以及数据 源A的K1个特征的加权后
特征贡献度WFWA和数据源B的K2个特征的加权后特征 贡献度WFWB进行可视化处理, 获得可视
化结果。
3.根据权利要求1或2所述的方法, 其特 征在于, 在所述a.之前还 包括如下步骤:
i.按纵向联邦学习, 联合数据源A的K1 维特征, 与数据源B的K2维特 征进行联合训练。
4.根据权利要求3所述的方法, 其特 征在于, 所述联合训练通过神经网络模型实现。
5.一种纵向联邦学习可解释性控制装置, 用于跨数据源隐私数据合作的建模效果评估
与数据贡献分析, 其特 征在于, 包括如下装置:
第一确定装置, 其用于确定数据源A的抽样数据XA={X1A,...,XnA}以及验证数据At, 确
定数据源B的抽样数据XB={X1B,...,XnB}以及验证数据Bt,其中XiA=[xAi1,...,xAiK1],XiB=
[xBi1,...,xBiK2], 所述数据源A 表示为[xA1,...,xAK1],数据源B表示 为[xB1,...,xBK2];
第一预测装置, 其用于应用神经网络模型对上述抽样数据进行预测, 并通过局部模型
方式进行 效果预测, 并计算数据 源A的效果权重WA=ACCA/(ACCA+ACCB)、 数据源B的效果权重
WB=ACCB/(ACCA+ACCB), 其中, ACCA为数据源A的局部模型效果、 A CCB为数据源A的局部模型效
果;
第二预测装置, 其用于通过神经网络模型对上述抽样数据进行预测, 得到预测结果Y=
{y1,...,yn}, 联合XA={X1A,...,XnA}与Y={y1,...,yn}训练局部线性模型LineModelA, 并通
过LineModelA获得数据源A的K1个特征的局部贡献度FWA=[fwA1,...,fwAK1]; 联合XB=
{X1B,...,XnB}与Y={y1,...,yn}训练局部线性模型LineModelB, 并通过LineModelB分析数据
源B的K2个特 征的局部贡献度FWB=[fwB1,...,fwBK2];
第一计算装置, 其用于按照数据源A效果权重WA,和数据源B效果权重WB分别对数据源A
的K1个特征的局部贡献度与数据源B的K2个特征的局部贡献度进行加权, 得到WFWA=WA*FWA权 利 要 求 书 1/2 页
2
CN 115271100 A
2=[WA*fwA1,...,WA*fwAK1]、 WFWB=WB*FWB=[WB*fwB1,...,WB*fwBK2]。
6.根据权利要求5所述的控制装置, 其特 征在于, 还 包括:
第二计算装置, 其用于对数据源A的效果权重WA,和数据源B的效果权重WB以及数据源A
的K1个特征的加权后特征贡献度WFWA和数据源B的K2个特征的加权后特征贡献度WFWB进行
可视化处 理, 获得可视化结果。
7.根据权利要求5或6所述的控制装置, 其特 征在于, 所示控制装置还 包括:
第一处理装置, 其用于按纵向联邦学习, 联合数据源A的K1维特征, 与数据源B的K2 维特
征进行联合训练。
8.根据权利要求7所述的控制装置, 其特征在于, 所述联合训练通过神经网络模型实
现。
9.一种通用型纵向联邦学习可解释性处 理系统, 其包括:
一个或多个服 务器, 存储多个数据源,
至少一个主处理器, 其包括根据权利要求5至8中任一项所述的控制装置, 且所述控制
装置根据权利要求1至4中任一项所述的控制方法对多个数据源进行处 理。
10.根据权利要求9所述处理系统, 其特征在于, 对所述多个数据源的处理结果通过可
视化方式进行展示, 所述展示内容包括如下的任一种或任多种:
对按效果评估的权 重对比展示;
正负样本贡献对比展示; 以及
不同企业数据贡献对比展示。权 利 要 求 书 2/2 页
3
CN 115271100 A
3
专利 纵向联邦学习可解释性控制方法、装置及处理系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:06:17上传分享