专利一种模型训练中的权重聚合方法、装置及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211229604.4 (22)申请日 2022.10.09 (71)申请人华控清交信息科技（北京）有限公司地址 100084 北京市海淀区中关村东路1号院3号楼10层10 09-1 (72)发明人陈智隆　陈琨　苏乐　 (74)专利代理机构北京市广友专利事务所有限责任公司 1 1237 专利代理师李欣 (51)Int.Cl. G06N 20/00(2019.01) G06F 21/60(2013.01) (54)发明名称一种模型训练中的权重聚合方法、装置及系统 (57)摘要本申请公开了一种模型训练中的权重聚合方法、装置及系统，涉及多方安全计算技术领域和隐私计算技术领域，包括：分片聚合设备接收模型训练设备发送的梯度分片，该梯度分片为该模型训练设备将模型训练得到的梯度进行拆分得到的多个梯度分片之一，该多个梯度分片的数量与多个分片聚合设备的数量相同，该多个梯度分片中的其他梯度分片分别由该模型训练设备一一对应的发送给其他分片聚合设备；当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片；向模型训练设备发送权重分片。采用本方案，实现了采用多方安全技术对机器学习模型的联合训练。权利要求书2页说明书10页附图5页 CN 115481754 A 2022.12.16 CN 115481754 A 1.一种模型训练中的权重聚合方法，其特征在于，应用于模型训练系统中的每个分片聚合设备，所述模型训练系统包括多个分片聚合设备和多个模型训练设备，所述方法，包括：接收模型训练设备发送的梯度分片，该梯度分片为该模型训练设备将模型训练得到的梯度进行拆分得到的多个梯度分片之一，该多个梯度分片的数量与所述多个分片聚合设备的数量相同，该多个梯度分片中的其他梯度分片分别由该模型训练设备一一对应的发送给其他分片聚合设备，其他每个分片聚合设备接收到其中一个梯度分片；当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片；向模型训练设备发送所述权重分片。 2.如权利要求1所述的方法，其特征在于，所述当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片，包括：当需要进行梯度聚合时，针对本次聚合所接收到的来自各模型训练设备的各梯度分片，确定其中是否存在不参与聚合的梯度分片，当一个梯度分片的其他属于同一梯度的梯度分片未全部被其他分片聚合设备接收到时，该梯度分片为不参与聚合的梯度分片；将本次聚合所接收到的来自各模型训练设备的各梯度分片中需要参与聚合的梯度分片进行聚合，得到本次聚合的权重分片。 3.如权利要求1所述的方法，其特征在于，所述当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，包括：当聚合周期到达时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合。 4.如权利要求1所述的方法，其特征在于，所述当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，包括：当接收到模型训练设备发送的权重请求时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合；所述向模型训练设备发送所述权重分片，包括：向发送所述权重请求的该模型训练设备发送所述权重分片。 5.一种模型训练中的权重聚合方法，其特征在于，应用于模型训练系统中的每个模型训练设备，所述模型训练系统包括多个分片聚合设备和多个模型训练设备，所述方法，包括：将本次模型训练得到的梯度拆分为多个梯度分片，该多个梯度分片的数量与所述多个分片聚合设备的数量相同；向所述多个分片聚合设备一一对应的发送所述多个梯度分片，每个分片聚合设备接收到其中一个梯度分片，使得分片聚合设备在接收到梯度分片后，当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片。 6.如权利要求5所述的方法，其特征在于，还包括：接收所述多个分片聚合设备发送的本次聚合的权重分片；权　利　要　求　书 1/2 页 2 CN 115481754 A 2将属于本次聚合的多个权重分片进行聚合，得到用于下次训练的权重。 7.如权利要求5所述的方法，其特征在于，在所述接收所述多个分片聚合设备发送的本次聚合的权重分片之前，还包括：向所述多个分片聚合设备发送权重请求。 8.一种模型训练中的权重聚合装置，其特征在于，应用于模型训练系统中的每个分片聚合设备，所述模型训练系统包括多个分片聚合设备和多个模型训练设备，所述装置，包括：梯度分片接收模块，用于接收模型训练设备发送的梯度分片，该梯度分片为该模型训练设备将模型训练得到的梯度进行拆分得到的多个梯度分片之一，该多个梯度分片的数量与所述多个分片聚合设备的数量相同，该多个梯度分片中的其他梯度分片分别由该模型训练设备一一对应的发送给其他分片聚合设备，其他每个分片聚合设备接收到其中一个梯度分片；梯度聚合模块，用于当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片；权重分片发送模块，用于向模型训练设备发送所述权重分片。 9.一种模型训练中的权重聚合装置，其特征在于，应用于模型训练系统中的每个模型训练设备，所述模型训练系统包括多个分片聚合设备和多个模型训练设备，所述装置，包括：梯度拆分模块，用于将本次模型训练得到的梯度拆分为多个梯度分片，该多个梯度分片的数量与所述多个分片聚合设备的数量相同；梯度分片发送模块，用于向所述多个分片聚合设备一一对应的发送所述多个梯度分片，每个分片聚合设备接收到其中一个梯度分片，使得分片聚合设备在接收到梯度分片后，当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片。 10.一种模型训练系统，其特征在于，包括：多个分片聚合设备和多个模型训练设备，所述分片聚合设备包括权利要求8所述的装置，所述模型训练设备包括权利要求9所述的装置。 11.一种电子设备，其特征在于，包括处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令，所述处理器被所述机器可执行指令促使：实现权利要求1 ‑4任一所述的方法，或者，实现权利要求5 ‑7任一所述的方法。 12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1 ‑4任一所述的方法，或者，实现权利要求5‑7任一所述的方法。权　利　要　求　书 2/2 页 3 CN 115481754 A 3

专利 一种模型训练中的权重聚合方法、装置及系统

专利一种模型训练中的权重聚合方法、装置及系统