(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111543857.4
(22)申请日 2021.12.16
(71)申请人 上海科技大 学
地址 201210 上海市浦东 新区华夏中路393
号
(72)发明人 石远明 杨展鹏 杨禹涵
(74)专利代理 机构 上海申汇 专利代理有限公司
31001
代理人 翁若莹 柏子雵
(51)Int.Cl.
H04L 41/0813(2022.01)
H04L 41/0823(2022.01)
H04L 41/14(2022.01)
H04L 41/16(2022.01)
H04L 9/32(2006.01)H04L 9/40(2022.01)
G06F 21/64(2013.01)
G06N 3/08(2006.01)
G06N 7/00(2006.01)
G06N 20/00(2019.01)
(54)发明名称
基于区块链的安全边缘联邦学习系统的设
计方法及其优化 算法
(57)摘要
本发明提供了一种基于区块链的安全边缘
联邦学习系统的设计方法, 利用基于实用拜占庭
容错方法的共识机制与鲁棒的全局模型聚合算
法, 抵抗了恶意边缘设备与恶意边缘服务器对 联
邦学习训练的攻击, 实现了安全 可信的边缘联邦
学习系统, 有效提升了边缘联邦学习模型训练的
收敛性能。 为进一步提升基于区块链的安全边缘
联邦学习系统的训练速度, 减少系统模型训练与
共识的时延, 本发明还提供了一种基于深度强化
学习的资源优化算法, 实现了在动态无线信道环
境下对无线带宽与发送功率的快速高效分配, 提
升安全边缘联邦学习系统的资源利用最大化, 进
而实现基于区块链的安全边缘联邦学习系统的
训练时延最小化。
权利要求书5页 说明书11页 附图2页
CN 114422354 A
2022.04.29
CN 114422354 A
1.一种基于区块链和鲁棒聚合的安全联邦学习系统的设计方法, 其特征在于, 使用基
于实用拜占庭容错算法的共识协议的区块链技术, 结合鲁邦的全局模型聚合算法, 构建出
基于区块链的安全边 缘联邦学习 系统, 具体包括以下步骤:
步骤1、 本地训练:
每个边缘设备使用其本地数据集, 通过优化算法训练本地模型
其中,
表示边缘设备k第t轮学习时的本地模型, η为学习率,
为第t轮学习时基
于
的随机梯度值,
表示边缘设备k第t轮学习时的本地模型;
步骤2、 上传本地模型:
在分配无线资源后, 各个边缘设备将本地模型
和该边缘设备对应的数字签名Dk作为
交易信息
以数字编码的形式上传至事先选 定的主边 缘服务器;
步骤3、 全局模型聚合:
主边缘服务器验证来自各个边缘设备的交易信 息以确认本地模型所有者的有效性, 并
基于聚合的本地更新, 执行智能合约multi_Krum得到第t轮学习的全局模型
主边缘服务
器将全局模型
和所有本地模型封装到一个新区块B中:
Bp
表示主边 缘服务器标识, D表示 边缘设备集 合;
步骤4、 预准备阶段:
边缘服务器生成预先准备信息, 并广播至区块链中的其他验证边缘服务器。 预先准备
信息的格式为<PRE_PREPARE,HB; D(B); B; Bp>, 其中, PRE_PREPARE表示 此信息为预准备信息,
HB表示新区块B高度, D(B)表示新区块B的哈希值; 该预先准 备信息由主边缘服务器Bp预先签
名; 验证边缘服务器接收新区块并验证交易信息和数字签名, 以确认新区块的有效性; 此
外, 各个验证边缘服务器基于新区块重新计算全局模型, 以确定主边缘服务器的计算正确;
验证之后, 每 个验证边 缘服务器将新区块存 储到本地;
步骤5、 准备阶段:
各个验证边缘服务器向其他所有服务器传输准备信息<PREPARE,HB; D(B); Bm>, Bm表示
验证边缘服务器的数字签名, PREPARE表 示此信息为准备信息; 所有验证边缘服务器接收准
备消息, 并确认大多数验证边 缘服务器已经验证了新区块B的正确性;
步骤6、 提交阶段:
各个验证边缘服务器向其他边缘服务器发送提交信息<C OMMIT,HB; D(B); Bm>, COMMIT表
示此信息为 提交信息, 确认大多数边 缘服务器已经达成一 致;
步骤7、 反馈阶段:
达成一致后, 各个验证边缘服务器向主边缘服务器传递反馈信息<REPLY,HB; D(B); Bm>,
REPLY表示此信息为反馈信息, 这表示新区块B已经存储在区块链中, 并且为下一次交易过
程做好了准备;
步骤8、 下 载全局模型:
主边缘服务器将经 过验证的全局模型广播至各个边 缘设备, 并开始下一轮学习。
2.如权利要求1所述的一种基于区块链和鲁棒聚合的安全联邦学习系统的设计方法,权 利 要 求 书 1/5 页
2
CN 114422354 A
2其特征在于, 步骤3中, 所述全局模型
表示为:
智能合约multi_Krum首先从输入梯度 集里选择平方欧几里德距离最接近的K ‑f‑2个相
邻的本地模型, 再从中选出K ‑f个距离最近的本地模型参数并通过平均得到全局模型, K表
示K个边缘设备, f表示 假设系统中存在的恶意设备的数量。
3.如权利要求1所述的一种基于区块链和鲁棒聚合的安全联邦学习系统的设计方法,
其特征在于, 步骤5中, 对于某一特定验证边缘服务器, 若接收到2f个匹配信息, 则认 为当前
验证边缘服务器对新区块B正确性的认证完成
4.一种基于深度强化学习的算法, 以提升通过如权利要求1所述设计方法获得的安全
联邦学习系统的通信效率, 其特征在于, 所述算法通过智能分配传输带宽和功率资源以降
低通过如权利要求 1所述设计方法获得的安全联邦学习系统的网络通信、 计算时延, 具体包
括以下步骤:
定义所涉及的优化问题如下式所示:
式中,
表示在第t轮学习过程中分配给d的传输带宽,
表示在第t轮学习过程中d的
传输功率, bmax表示最大传输带宽, pmax表示最大传输功率, T(bt,pt)表示权利要求1所述的一
种基于区块链的安全边缘联邦学习系统的设计方法所有步骤的通信时延、 计算时延的总
和, 即有: T(bt,pt)=Tcom+Tcmp, Tcom表示权利要求1所述的一种基于区块链的安全边缘 联邦学
习系统的设计方法中所有的传输时延的总和, Tcmp表示权利要求 1所述的一种基于区块链的
安全边缘联邦学习 系统的设计方法中所有的计算时延的总和;
将优化问题转 化为如式(2)所示的一个马尔可 夫决策过程:
式(2)中, π*表示最优的资源分配策略,
为信道状态信息, at={bt,pt},
rt=‑T(bt,pt), γ∈
[0,1];
通过双延迟深度确定性策略梯度算法对式(2)所示的问题求 解。
5.如权利要求4所述的一种基于深度强化学习的算法, 其特征在于, 所述所有的传输时
延的总和Tcom为权利要求1所述的设计方法中所述步骤2中上传本地模型更新到主边缘服务
器所需要的传输时延
步骤4的传输时延
步骤5的传输时延
步骤6的传输时
延
步骤7的传输时延
以及步骤8的传输时延
之和, 其中:权 利 要 求 书 2/5 页
3
CN 114422354 A
3
专利 基于区块链的安全边缘联邦学习系统的设计方法及其优化算法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:16:48上传分享