专利基于区块链的安全边缘联邦学习系统的设计方法及其优化算法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111543857.4 (22)申请日 2021.12.16 (71)申请人上海科技大学地址 201210 上海市浦东新区华夏中路393 号 (72)发明人石远明　杨展鹏　杨禹涵　 (74)专利代理机构上海申汇专利代理有限公司 31001 代理人翁若莹　柏子雵 (51)Int.Cl. H04L 41/0813(2022.01) H04L 41/0823(2022.01) H04L 41/14(2022.01) H04L 41/16(2022.01) H04L 9/32(2006.01)H04L 9/40(2022.01) G06F 21/64(2013.01) G06N 3/08(2006.01) G06N 7/00(2006.01) G06N 20/00(2019.01) (54)发明名称基于区块链的安全边缘联邦学习系统的设计方法及其优化算法 (57)摘要本发明提供了一种基于区块链的安全边缘联邦学习系统的设计方法，利用基于实用拜占庭容错方法的共识机制与鲁棒的全局模型聚合算法，抵抗了恶意边缘设备与恶意边缘服务器对联邦学习训练的攻击，实现了安全可信的边缘联邦学习系统，有效提升了边缘联邦学习模型训练的收敛性能。为进一步提升基于区块链的安全边缘联邦学习系统的训练速度，减少系统模型训练与共识的时延，本发明还提供了一种基于深度强化学习的资源优化算法，实现了在动态无线信道环境下对无线带宽与发送功率的快速高效分配，提升安全边缘联邦学习系统的资源利用最大化，进而实现基于区块链的安全边缘联邦学习系统的训练时延最小化。权利要求书5页说明书11页附图2页 CN 114422354 A 2022.04.29 CN 114422354 A 1.一种基于区块链和鲁棒聚合的安全联邦学习系统的设计方法，其特征在于，使用基于实用拜占庭容错算法的共识协议的区块链技术，结合鲁邦的全局模型聚合算法，构建出基于区块链的安全边缘联邦学习系统，具体包括以下步骤：步骤1、本地训练：每个边缘设备使用其本地数据集，通过优化算法训练本地模型其中，表示边缘设备k第t轮学习时的本地模型， η为学习率，为第t轮学习时基于的随机梯度值，表示边缘设备k第t轮学习时的本地模型；步骤2、上传本地模型：在分配无线资源后，各个边缘设备将本地模型和该边缘设备对应的数字签名Dk作为交易信息以数字编码的形式上传至事先选定的主边缘服务器；步骤3、全局模型聚合：主边缘服务器验证来自各个边缘设备的交易信息以确认本地模型所有者的有效性，并基于聚合的本地更新，执行智能合约multi_Krum得到第t轮学习的全局模型主边缘服务器将全局模型和所有本地模型封装到一个新区块B中： Bp 表示主边缘服务器标识， D表示边缘设备集合；步骤4、预准备阶段：边缘服务器生成预先准备信息，并广播至区块链中的其他验证边缘服务器。预先准备信息的格式为<PRE_PREPARE,HB； D(B)； B； Bp>，其中， PRE_PREPARE表示此信息为预准备信息， HB表示新区块B高度， D(B)表示新区块B的哈希值；该预先准备信息由主边缘服务器Bp预先签名；验证边缘服务器接收新区块并验证交易信息和数字签名，以确认新区块的有效性；此外，各个验证边缘服务器基于新区块重新计算全局模型，以确定主边缘服务器的计算正确；验证之后，每个验证边缘服务器将新区块存储到本地；步骤5、准备阶段：各个验证边缘服务器向其他所有服务器传输准备信息<PREPARE,HB； D(B)； Bm>， Bm表示验证边缘服务器的数字签名， PREPARE表示此信息为准备信息；所有验证边缘服务器接收准备消息，并确认大多数验证边缘服务器已经验证了新区块B的正确性；步骤6、提交阶段：各个验证边缘服务器向其他边缘服务器发送提交信息<C OMMIT,HB； D(B)； Bm>， COMMIT表示此信息为提交信息，确认大多数边缘服务器已经达成一致；步骤7、反馈阶段：达成一致后，各个验证边缘服务器向主边缘服务器传递反馈信息<REPLY,HB； D(B)； Bm>， REPLY表示此信息为反馈信息，这表示新区块B已经存储在区块链中，并且为下一次交易过程做好了准备；步骤8、下载全局模型：主边缘服务器将经过验证的全局模型广播至各个边缘设备，并开始下一轮学习。 2.如权利要求1所述的一种基于区块链和鲁棒聚合的安全联邦学习系统的设计方法，权　利　要　求　书 1/5 页 2 CN 114422354 A 2其特征在于，步骤3中，所述全局模型表示为：智能合约multi_Krum首先从输入梯度集里选择平方欧几里德距离最接近的K ‑f‑2个相邻的本地模型，再从中选出K ‑f个距离最近的本地模型参数并通过平均得到全局模型， K表示K个边缘设备， f表示假设系统中存在的恶意设备的数量。 3.如权利要求1所述的一种基于区块链和鲁棒聚合的安全联邦学习系统的设计方法，其特征在于，步骤5中，对于某一特定验证边缘服务器，若接收到2f个匹配信息，则认为当前验证边缘服务器对新区块B正确性的认证完成 4.一种基于深度强化学习的算法，以提升通过如权利要求1所述设计方法获得的安全联邦学习系统的通信效率，其特征在于，所述算法通过智能分配传输带宽和功率资源以降低通过如权利要求 1所述设计方法获得的安全联邦学习系统的网络通信、计算时延，具体包括以下步骤：定义所涉及的优化问题如下式所示：式中，表示在第t轮学习过程中分配给d的传输带宽，表示在第t轮学习过程中d的传输功率， bmax表示最大传输带宽， pmax表示最大传输功率， T(bt,pt)表示权利要求1所述的一种基于区块链的安全边缘联邦学习系统的设计方法所有步骤的通信时延、计算时延的总和，即有： T(bt,pt)＝Tcom+Tcmp， Tcom表示权利要求1所述的一种基于区块链的安全边缘联邦学习系统的设计方法中所有的传输时延的总和， Tcmp表示权利要求 1所述的一种基于区块链的安全边缘联邦学习系统的设计方法中所有的计算时延的总和；将优化问题转化为如式(2)所示的一个马尔可夫决策过程：式(2)中， π*表示最优的资源分配策略，为信道状态信息， at＝{bt,pt}， rt＝‑T(bt,pt)， γ∈ [0,1]；通过双延迟深度确定性策略梯度算法对式(2)所示的问题求解。 5.如权利要求4所述的一种基于深度强化学习的算法，其特征在于，所述所有的传输时延的总和Tcom为权利要求1所述的设计方法中所述步骤2中上传本地模型更新到主边缘服务器所需要的传输时延步骤4的传输时延步骤5的传输时延步骤6的传输时延步骤7的传输时延以及步骤8的传输时延之和，其中：权　利　要　求　书 2/5 页 3 CN 114422354 A 3

专利 基于区块链的安全边缘联邦学习系统的设计方法及其优化算法

专利基于区块链的安全边缘联邦学习系统的设计方法及其优化算法