说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111683309.1 (22)申请日 2021.12.3 0 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 王宁涛 周璟 吕乐 杨阳  范东云 傅幸 王维强  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 代理人 陈霁 周良玉 (51)Int.Cl. G06F 21/62(2013.01) G06N 20/00(2019.01) (54)发明名称 一种基于隐私保护的模型训练方法及装置 (57)摘要 本说明书实施例提供一种基于隐私保护的 模型训练方法及装置, 获得用于训练目标业务模 型的初始事件序列集合; 针对所述初始事件序列 集合中的各初始事件序列, 根据第一增强策略的 策略信息, 基于预设的用于进行数据扰动修改 的 多个数据增强单元, 对该初始事件序列进行第一 数目的数据增强操作, 得到对应的增强事件序 列, 其中, 一次数据增强操作利用一个数据增强 单元执行; 策略信息至少指示所述第一数目; 利 用各增强事件序列形成的第一增强序列集合进 行模型训练, 得到隐私保护的第一 业务模型。 权利要求书2页 说明书15页 附图2页 CN 114357517 A 2022.04.15 CN 114357517 A 1.一种基于隐私保护的模型训练方法, 包括: 获得用于训练目标业 务模型的初始事 件序列集 合; 针对所述初始事件序列集合中的各初始事件序列, 根据第一增强策略的策略信息, 基 于预设的用于进 行数据扰动修改的多个数据增强单元, 对该初始事件序列进 行第一数目的 数据增强操作, 得到对应的增强事件序列, 其中, 一次数据增强操作利用一个数据增强单元 执行; 所述策略信息 至少指示所述第一数目; 利用各增强事件序列 形成的第 一增强序列集合进行模型训练, 得到隐私保护的第 一业 务模型。 2.根据权利要求1所述的方法, 其中, 所述数据增强单元, 用于扰动修改以下中的一项 或多项: 事件序列中事 件的顺序、 数量、 属性。 3.根据权利要求1所述的方法, 还 包括: 获得所述第一 业务模型对应的第一效能结果; 根据所述第一效能结果和所述第一增强策略, 确定用于下一轮次的第二增强策略。 4.根据权利要求1所述的方法, 还 包括: 获得所述第一 业务模型对应的第一效能结果; 至少根据 所述第一效能结果和所述第 一业务模型, 确定所述目标业务模型对应的目标 隐私保护模型, 或其备选模型。 5.根据权利要求4所述的方法, 其中, 所述确定所述目标业务模型对应的目标隐私保护 模型, 或其备选模型, 包括: 获得所述初始事件序列集合对应的若干第二增强序列集合, 其中, 各第二增强序列集 合, 根据对应增强策略的策略信息, 基于所述多个数据增强单元, 对 所述初始事件序列集合 进行数据增强操作而得到; 分别利用各第二增强序列集 合进行模型训练, 得到对应的若干第二 业务模型; 获得若干第二 业务模型对应的若干第二效能结果; 基于所述第 一效能结果和所述第 二效能结果, 从所述第 一业务模型和若干第 二业务模 型中, 确定出 所述目标隐私保护模型, 或所述备选模型。 6.根据权利要求5所述的方法, 还 包括: 获得所述目标业务模型对应的目标效能结果, 所述目标业务模型利用所述初始事件序 列集合训练得到; 所述从所述第一业务模型和若干第二业务模型中, 确定出所述目标隐私保护模型, 或 所述备选模型, 包括: 分别确定所述第 一效能结果和若干第 二效能结果, 相对于所述目标效能结果的效能变 化情况; 基于各效能变化情况, 从所述第一业务模型和所述若干第二业务模型中, 确定出效能 变化情况表征效能较优的业 务模型, 作为所述目标隐私保护模型。 7.根据权利要求3所述的方法, 其中, 所述第一效能结果包括如下结果的至少一个: 业 务预测准确性, 被黑盒攻击成功的概 率。 8.根据权利要求1 ‑7任一项所述的方法, 其中, 所述策略信息还包括: 扰动强度值, 所述 第一数目的数据增强操作包括第一增强操作, 所述第一增强操作利用第一增强操作单元进权 利 要 求 书 1/2 页 2 CN 114357517 A 2行符合所述扰动强度值的数据扰动。 9.根据权利要求1 ‑7任一项所述的方法, 其中, 所述数据扰动修改包括对事件序列中事 件顺序和/或数量的扰动修改; 所述多个数据增强单元包括用于执行以下操作中的至少一 项的数据增强单 元: 删除事件序列中的部分事 件; 从事件序列中抽取出若干第 一事件, 对所述若干第 一事件无放 回抽样重排后放回事件 序列; 从事件序列中抽取出若干第 二事件, 对所述若干第 二事件有放 回抽样重排后放回事件 序列; 将事件序列中包 含的第三事 件修改为第四事 件; 保持事件序列。 10.根据权利要求1 ‑7任一项所述的方法, 其中, 所述数据扰动修改包括对事件序列中 事件的属性的扰动修改; 所述多个数据增强单元包括用于执行以下操作中的至少一项的数 据增强单 元: 针对事件序列中第五事件的数值型的第 一属性, 利用该第 一属性的各属性值对应的高 斯分布, 对该第一属性的属性 值进行扰动修改; 针对事件序列中第六事件的类别型的第 二属性, 利用该第 二属性的各属性值对应的先 验分布, 对该第二属性的属性 值进行扰动修改。 11.根据权利要求10所述的方法, 其中, 所述策略信息还包括扰动强度值; 所述利用该 第一属性的各属性 值对应的高斯分布, 对该第一属性的属性 值进行扰动修改, 包括: 基于该第一属性的各属性值对应的高斯分布, 生成该第五事件的第 一属性对应的扰动 值; 基于所述扰动值以及所述扰动强度值, 对该第一属性的属性 值进行扰动修改。 12.根据权利要求1 ‑7任一项所述的方法, 其中, 一次数据增强操作所利用的数据增强 单元, 是以等 概率方式从所述多个数据增强单 元中随机 选择的。 13.一种基于隐私保护的模型训练装置, 包括: 第一获得模块, 配置为获得用于训练目标业 务模型的初始事 件序列集 合; 数据增强模块, 配置为针对所述初始事件序列集合中的各初始事件序列, 根据第一增 强策略的策略信息, 基于预设的用于进行数据扰动修改的多个数据增强单元, 对该初始事 件序列进 行第一数目的数据增强操作, 得到对应的增强事件序列, 其中, 一次数据增强操作 利用一个数据增强单 元执行; 所述策略信息 至少指示所述第一数目; 模型训练模块, 配置为利用各增强事件序列形成的第一增强序列集合进行模型训练, 得到隐私保护的第一 业务模型。 14.一种计算设备, 包括存储器和处理器, 其中, 所述存储器中存储有可执行代码, 所述 处理器执行所述可执行代码时, 实现权利要求1 ‑12中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114357517 A 3

.PDF文档 专利 一种基于隐私保护的模型训练方法及装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于隐私保护的模型训练方法及装置 第 1 页 专利 一种基于隐私保护的模型训练方法及装置 第 2 页 专利 一种基于隐私保护的模型训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:28:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。