说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111386087.7 (22)申请日 2021.11.22 (71)申请人 北京理工大 学 地址 100081 北京市海淀区中关村南大街5 号 (72)发明人 李侃 李洋 (74)专利代理 机构 北京京万通知识产权代理有 限公司 1 1440 代理人 刘浩 许天易 (51)Int.Cl. G06N 3/08(2006.01) G06N 20/00(2019.01) G06N 3/04(2006.01) (54)发明名称 一种面向非独立同分布数据的联邦互学习 模型训练方法 (57)摘要 本发明提供了一种面向非独立同分布数据 的联邦互学习模型训练方法, 包括: S1、 将初始全 局模型参数发送至中间客户端, 中间客户端生成 中间客户端模型参数, S2、 边缘客户端利用本地 数据集生成边缘客户端模型参数; S3、 中间客户 端和边缘客户端利用互学习方法更新参数; S4、 将中间客户端模型输出的概率预测值上传至服 务器, 服务器利用蒸馏技术更新全局模型和中间 客户端模型; S5、 执行步骤S3~S4, 直到模型满足 收敛条件, 得到最终的中间客户端模型、 边缘客 户端模型和全局模型, 然后服务器将最终的全局 模型广播到所有边缘客户端。 在本发明中, 通过 分组互学习和知识蒸馏方法解决非独立同分布 数据的联邦学习通信带宽限制和模型生成的问 题。 权利要求书2页 说明书8页 附图2页 CN 114091667 A 2022.02.25 CN 114091667 A 1.一种面向非独立同分布数据的联邦互学习模型训练方法, 其特征在于, 所述方法包 括: S1、 服务器将初始化全局模型参数发送至各组的中间客户端, 中间客户端利用中间客 户端数据集生成中间客户端模型参数, 将生成的中间客户端模型参数发送到组内的边缘客 户端; S2、 边缘客户端接收中间客户端模型参数, 边缘客户端利用本地数据集生成边缘客户 端模型参数; S3、 组内的中间客户端和边缘客户端利用互学习方法, 执行多轮训练, 更新中间客户端 模型参数和边 缘客户端模型参数; S4、 所有组的中间客户端将中间客户端模型的标签类别概率预测值上传至服务器, 更 新全局模型参数; S5、 重复执行步骤S3 ‑S4, 直到满足收敛条件,得到中间客户端模型、 边缘客户端模型和 全局模型, 服 务器将生成的最终全局模型广播到所有边 缘客户端。 2.根据权利要求1所述的模型训练方法, 其特征在于, 全局模型、 中间客户端模型、 边缘 客户端模型为神经网络模型。 3.根据权利要求1所述的模型训练方法, 其特征在于, 在步骤S2中, 中间客户端和边缘 客户端分别在本地数据集上利用随机梯度下降算法更新模型参数。 4.根据权利要求1所述的模型训练方法, 其特 征在于, 在步骤S3中, 互学习方法包括: S31、 将组内的所有边缘客户端模型在t轮时的输出记为 C为边缘客 户端的数量, 计算标签类别的概率预测值 并传输到中间客户端; i表示第i个中间客户 端, j表示第i个中间客户端连接的第j个边 缘客户端; S32、 第i组的中间客户端计算 c表示边缘客户端, 计 算第i组的中间客户端模型与组内边缘客户端模型的KL散度DKL和第i组的中间客户端模型 的损失函数 S33、 第i组的中间客户端在中间客户端数据集上利用随机梯度 下降算法更新中间客户 端模型参数 S34、 第i组的第j个边 缘客户端计算KL散度DKL和损失函数 S35、 边缘客户端在边缘客户端数据集上利用随机梯度下降算法更新边缘客户端模型 参数 S36、 执行N轮S3 1‑S35后, 所有的中间客户端计算标签类别的概率预测值 并传输至 服务器。 5.根据权利要求4所述的模型训练方法, 其特征在于, 所述步骤S31中, 散度公式为: m表示中间客户端, 表示第i组的中间客户权 利 要 求 书 1/2 页 2 CN 114091667 A 2端第t轮的标签类别的概率预测值 , 第i组的中间客 户端模型的 损失函数为 6.根据权利要求4所述的模型训练方法, 其特征在于, 所述步骤S34中, 损失函数的计算 公式为: 7.根据权利要求4所述的模型训练方法, 其特征在于, 边缘客户端模型的Softmax函数 中添加温度参数T, 用于调整输出的概率分布, 边缘客户端计算得到对应标签类别的概率预 测值 8.根据权利要求4所述的模型训练方法, 其特征在于, 服务器接收中间客户端模型的对 应标签类别的概 率预测值 中间客户端的输出 i表 示第i个中间客户端, m表示中间客户端类型, 采用蒸馏学习方法更新全局模型, 蒸馏学习方 法包括: S41、 服务器计算全局模型的损失函数 z表示服务器与中间客户端的 交互轮数, 公式为: S42 、 在服务器的 本地数 据集上 利 用梯度下降 算法更新全 局模型参数 : z为中间客户端和边 缘客户端相互学习的轮数; S 4 3 、各 组 中 间 客 户 端 分 别 计 算 K L 散 度 和 损 失 函 数 , 公 式 为 : 权 利 要 求 书 2/2 页 3 CN 114091667 A 3
专利 一种面向非独立同分布数据的联邦互学习模型训练方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 01:20:54
上传分享
举报
下载
原文档
(875.9 KB)
分享
友情链接
DB3201-T 1113-2022 法人主数据规范 南京市.pdf
GB-T 20937-2018 硫酸钾镁肥.pdf
北京金融产业联盟 金融行业云原生安全体系研究报告 2024.pdf
T-CATSI 05002—2020 高压液化气体管束式集装箱专项技术要求.pdf
T-CADERM 3008—2019 严重过敏反应诊断和早期治疗规范.pdf
GoogleCloud 自动化安全运营中心soc建设指南 OfficeofCISO AutonomicSecurityOperations 10x 英文 .pdf
GB-T 14982-2008 粘土质耐火泥浆.pdf
DB5301-T 79-2022 计量器具监督抽查工作规范 流通领域 昆明市.pdf
GB-T 11969-2020 蒸压加气混凝土性能试验方法.pdf
DB51-T 2799-2021 四川省高速公路景观及绿化设计指南 四川省.pdf
DB4401-T 28-2019 排水管渠维修养护技术规范 广州市.pdf
GB-T 30273-2013 信息安全技术 信息系统安全保障通用评估指南.pdf
JR-T 0231—2021 银行业第三方软件开发工具包(SDK)安全接入指南.pdf
NY-T 2207-2019 轮式拖拉机能效等级评价.pdf
GB-T 42855-2023 氢燃料电池车辆加注协议技术要求.pdf
JR-T 0071.2—2020 金融行业网络安全等级保护实施指引 第2部分:基本要求.pdf
GB-T 42509-2023 质量管理 顾客体验管理指南.pdf
GB-T 40370-2021 燃气-蒸汽联合循环热电联产能耗指标计算方法.pdf
阿里 云上数字政府之数据安全建设指南.pdf
DB4403-T 339-2023 城市级实景三维数据规范 深圳市.pdf
1
/
3
13
评价文档
赞助1.5元 点击下载(875.9 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。