说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210651571.6 (22)申请日 2022.06.10 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 吴若凡  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 李世喆 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) G06V 10/80(2022.01) G06Q 10/04(2012.01) (54)发明名称 属性预测模 型的训练方法、 属性预测方法和 装置 (57)摘要 本说明书实施例描述了属性预测模型的训 练方法、 属性预测方法和装置。 根据实施例的方 法, 首先需要将利用网络行为数据构建的图网络 拆分为多个子网络。 然后计算各个子网络中的第 一节点的损失函数值, 并计算损失函数值满足分 布漂移约束时的权重值, 进一步利用得到的权重 值即可训练得到属性预测模型。 由于权重值是在 满足损失函数分布漂移约束的条件 下得到的, 即 实现了对模型训练数据和预测数据随时间变化 呈现的不一致规律的约束。 因此, 基于本方案能 够有效缓解分布漂移带来的模型性能衰减的问 题, 从而提高利用该模型进行属性预测的准确 性。 权利要求书3页 说明书13页 附图4页 CN 115222040 A 2022.10.21 CN 115222040 A 1.属性预测模型的训练方法, 包括: 基于业务场景记录的网络行为数据构建图网络; 从所述图网络 中得到至少两个子网络; 其中, 每一个子网络 中均包括第 一节点, 以及至 少一个与所述第一节 点具有连边关系的第二节点, 且任意两个子网络中所包含的节点不完 全相同; 所述节点 为基于所述网络行为数据得到的实体; 针对每个子网络, 计算该当前子网络中的第一节点相对于标签值的损失函数值; 根据各个所述损 失函数值, 计算各个子网络的损 失函数满足分布漂移约束的权重值; 其中, 所述分布漂移约束用于表征对模型训练数据和预测数据随时间变化呈现的不一致规 律进行约束; 利用得到的损失函数的权 重值, 训练所述属性预测模型。 2.根据权利要求1所述的方法, 其中, 所述从图网络中得到 至少两个子网络, 包括: 在所述图网络中, 以所述第一节点为基点, 向具有连边关系的其他节点按照至少两条 路径进行延伸; 其中, 所述路径包括延伸的方向和延伸的深度中的至少一个; 将通过所述至少两条路径得到的至少两个节点集合确定为所述至少两个子网络; 其 中, 每一条路径均得到一个节点 集合, 每一个节点 集合构成一个子网络 。 3.根据权利要求1所述的方法, 其中, 所述计算该当前子网络 中的第一节点相对于标签 值的损失函数值, 包括: 计算所述当前子网络中所述第一节点的融合表征; 其中, 所述融合表征用于表征该当 前子网络中所有节点对所述第一节点的属性进行 预测时的贡献表征; 根据所述第 一节点的融合表征和预先设定的标签信 息, 计算所述当前子网络中的第 一 节点的损失函数值。 4.根据权利要求3所述的方法, 其中, 所述计算所述当前子网络中所述第 一节点的融合 表征, 包括: 针对训练所述属性预测模型时的每一个隐藏层, 均执 行: 针对当前子网络 中的每个第 二节点, 将该第 二节点的表征融合到所述第 一节点的表征 中, 得到对应该第二节点的第一融合表征; 将针对各个第二节点得到的第一融合表征进行聚合, 得到第二融合表征; 将所述第二融合表征与所述当前子网络中上一个隐藏层得到的第一节点的融合表征 进行合并, 得到所述当前子网络中所述第一节点在当前隐藏层的融合表征。 5.根据权利要求4所述的方法, 其中, 所述将该第 二节点的表征融合到所述第 一节点的 表征中得到对应该第二节点的第一融合表征, 包括: 利用如下计算式, 计算所述第一融合表征: h′= δ(Hu, Hv) 其中, h′用于表征所述第一融合表征, Hu用于表征所述第一节点的表征, Hv用于表征所 述第二节点的表征, δ( ·)为激活函数。 6.根据权利要求4所述的方法, 其中, 所述针对各个第 二节点得到的第 一融合表征进行 聚合得到第二融合表征, 包括: 利用如下计算式, 计算所述第二融合表征: h″=AGG(h′1,h′2,…,h′j,…,h′n)权 利 要 求 书 1/3 页 2 CN 115222040 A 2其中, h″用于表征所述第二融合表征, h ′j用于表征当前子网络中通过第j个第二节点得 到的第一融合表征, n 为当前子网络中第二节点的个数, AG G为聚合函数。 7.根据权利要求4所述的方法, 其中, 所述将所述第 二融合表征与所述当前子网络 中上 一个隐藏层得到的第一节点的融合表征进行合并得到所述当前子网络中所述第一节点在 当前隐藏层的融合表征, 包括: 利用如下计算式, 计算所述融合表征: h(l+1)=COMBINE(h(l),h″) 其中, h(l+1)用于表征在当前第l+1个隐藏层的融合表征, h(l)用于表征第l个隐藏层得到 的融合表征, 且, 第l个隐藏层为第l +1个隐藏层的上一个隐藏层, h ″用于表征所述第二融合 表征, COMBI NE(·)为合并函数。 8.根据权利要求1所述的方法, 其中, 所述根据各个所述损失函数值计算各个子网络的 损失函数满足分布漂移约束的权 重值, 包括: 在各个损失函数值对应的实际权重值满足的概率分布与第一概率分布之间的距离小 于第一预设值的条件 下, 计算损失函数取得最大值时的权重值; 其中, 所述第一概率分布用 于表征所述各个损失函数值对应的权 重值满足均匀分布时的概 率分布。 9.根据权利要求1至8中任一所述的方法, 其中, 所述根据各个所述损 失函数值计算各 个子网络的损失函数满足分布漂移约束的权 重值, 包括: 利用如下计算式, 计算各个子网络的权 重值: 其中, Q*用于表征各个子网络的权重值的集合, qi用于表征第i个子网络的权重值, l用 于表征损失函数, θ用于表征当前训练的属性预测模型的参数, Xi用于表征第i个子网络的 损失函数值, n用于表征子网络的个数, 用于表征Q和 之间的散度, Q用于表征 各个损失函数值对应的实际权重满足的概率分布, 用于表征所述各个损失函数值对应的 权重值满足均匀分布时的概率分布, ρ用于表征第一预设值, argmax用于表征损失值最大时 的权重的取值。 10.根据权利要求1所述的方法, 其中, 所述利用得到的损失函数的权重值训练所述属 性预测模型, 包括: 计算各个子网络对应得到的损失函数的权 重值的加权平均和; 以及, 根据所述权 重值的加权平均和, 利用随机梯度算法训练所述属性预测模型。 11.根据权利要求10所述的方法, 其中, 所述计算各个子网络对应得到的损失函数的权 重值的加权平均和, 包括: 利用如下计算式, 计算各子网络的权 重值的加权平均和: 其中, q用于表征各子网络的权重值的加权平均和, qi用于表征第i个子网络的权重值, l权 利 要 求 书 2/3 页 3 CN 115222040 A 3

.PDF文档 专利 属性预测模型的训练方法、属性预测方法和装置

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 属性预测模型的训练方法、属性预测方法和装置 第 1 页 专利 属性预测模型的训练方法、属性预测方法和装置 第 2 页 专利 属性预测模型的训练方法、属性预测方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:50:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。