专利属性预测模型的训练方法、属性预测方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210651571.6 (22)申请日 2022.06.10 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人吴若凡　 (74)专利代理机构济南信达专利事务所有限公司 37100 专利代理师李世喆 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) G06V 10/80(2022.01) G06Q 10/04(2012.01) (54)发明名称属性预测模型的训练方法、属性预测方法和装置 (57)摘要本说明书实施例描述了属性预测模型的训练方法、属性预测方法和装置。根据实施例的方法，首先需要将利用网络行为数据构建的图网络拆分为多个子网络。然后计算各个子网络中的第一节点的损失函数值，并计算损失函数值满足分布漂移约束时的权重值，进一步利用得到的权重值即可训练得到属性预测模型。由于权重值是在满足损失函数分布漂移约束的条件下得到的，即实现了对模型训练数据和预测数据随时间变化呈现的不一致规律的约束。因此，基于本方案能够有效缓解分布漂移带来的模型性能衰减的问题，从而提高利用该模型进行属性预测的准确性。权利要求书3页说明书13页附图4页 CN 115222040 A 2022.10.21 CN 115222040 A 1.属性预测模型的训练方法，包括：基于业务场景记录的网络行为数据构建图网络；从所述图网络中得到至少两个子网络；其中，每一个子网络中均包括第一节点，以及至少一个与所述第一节点具有连边关系的第二节点，且任意两个子网络中所包含的节点不完全相同；所述节点为基于所述网络行为数据得到的实体；针对每个子网络，计算该当前子网络中的第一节点相对于标签值的损失函数值；根据各个所述损失函数值，计算各个子网络的损失函数满足分布漂移约束的权重值；其中，所述分布漂移约束用于表征对模型训练数据和预测数据随时间变化呈现的不一致规律进行约束；利用得到的损失函数的权重值，训练所述属性预测模型。 2.根据权利要求1所述的方法，其中，所述从图网络中得到至少两个子网络，包括：在所述图网络中，以所述第一节点为基点，向具有连边关系的其他节点按照至少两条路径进行延伸；其中，所述路径包括延伸的方向和延伸的深度中的至少一个；将通过所述至少两条路径得到的至少两个节点集合确定为所述至少两个子网络；其中，每一条路径均得到一个节点集合，每一个节点集合构成一个子网络。 3.根据权利要求1所述的方法，其中，所述计算该当前子网络中的第一节点相对于标签值的损失函数值，包括：计算所述当前子网络中所述第一节点的融合表征；其中，所述融合表征用于表征该当前子网络中所有节点对所述第一节点的属性进行预测时的贡献表征；根据所述第一节点的融合表征和预先设定的标签信息，计算所述当前子网络中的第一节点的损失函数值。 4.根据权利要求3所述的方法，其中，所述计算所述当前子网络中所述第一节点的融合表征，包括：针对训练所述属性预测模型时的每一个隐藏层，均执行：针对当前子网络中的每个第二节点，将该第二节点的表征融合到所述第一节点的表征中，得到对应该第二节点的第一融合表征；将针对各个第二节点得到的第一融合表征进行聚合，得到第二融合表征；将所述第二融合表征与所述当前子网络中上一个隐藏层得到的第一节点的融合表征进行合并，得到所述当前子网络中所述第一节点在当前隐藏层的融合表征。 5.根据权利要求4所述的方法，其中，所述将该第二节点的表征融合到所述第一节点的表征中得到对应该第二节点的第一融合表征，包括：利用如下计算式，计算所述第一融合表征： h′＝ δ(Hu， Hv) 其中， h′用于表征所述第一融合表征， Hu用于表征所述第一节点的表征， Hv用于表征所述第二节点的表征， δ( ·)为激活函数。 6.根据权利要求4所述的方法，其中，所述针对各个第二节点得到的第一融合表征进行聚合得到第二融合表征，包括：利用如下计算式，计算所述第二融合表征： h″＝AGG(h′1,h′2,…,h′j,…,h′n)权　利　要　求　书 1/3 页 2 CN 115222040 A 2其中， h″用于表征所述第二融合表征， h ′j用于表征当前子网络中通过第j个第二节点得到的第一融合表征， n 为当前子网络中第二节点的个数， AG G为聚合函数。 7.根据权利要求4所述的方法，其中，所述将所述第二融合表征与所述当前子网络中上一个隐藏层得到的第一节点的融合表征进行合并得到所述当前子网络中所述第一节点在当前隐藏层的融合表征，包括：利用如下计算式，计算所述融合表征： h(l+1)＝COMBINE(h(l),h″) 其中， h(l+1)用于表征在当前第l+1个隐藏层的融合表征， h(l)用于表征第l个隐藏层得到的融合表征，且，第l个隐藏层为第l +1个隐藏层的上一个隐藏层， h ″用于表征所述第二融合表征， COMBI NE(·)为合并函数。 8.根据权利要求1所述的方法，其中，所述根据各个所述损失函数值计算各个子网络的损失函数满足分布漂移约束的权重值，包括：在各个损失函数值对应的实际权重值满足的概率分布与第一概率分布之间的距离小于第一预设值的条件下，计算损失函数取得最大值时的权重值；其中，所述第一概率分布用于表征所述各个损失函数值对应的权重值满足均匀分布时的概率分布。 9.根据权利要求1至8中任一所述的方法，其中，所述根据各个所述损失函数值计算各个子网络的损失函数满足分布漂移约束的权重值，包括：利用如下计算式，计算各个子网络的权重值：其中， Q*用于表征各个子网络的权重值的集合， qi用于表征第i个子网络的权重值， l用于表征损失函数， θ用于表征当前训练的属性预测模型的参数， Xi用于表征第i个子网络的损失函数值， n用于表征子网络的个数，用于表征Q和之间的散度， Q用于表征各个损失函数值对应的实际权重满足的概率分布，用于表征所述各个损失函数值对应的权重值满足均匀分布时的概率分布， ρ用于表征第一预设值， argmax用于表征损失值最大时的权重的取值。 10.根据权利要求1所述的方法，其中，所述利用得到的损失函数的权重值训练所述属性预测模型，包括：计算各个子网络对应得到的损失函数的权重值的加权平均和；以及，根据所述权重值的加权平均和，利用随机梯度算法训练所述属性预测模型。 11.根据权利要求10所述的方法，其中，所述计算各个子网络对应得到的损失函数的权重值的加权平均和，包括：利用如下计算式，计算各子网络的权重值的加权平均和：其中， q用于表征各子网络的权重值的加权平均和， qi用于表征第i个子网络的权重值， l权　利　要　求　书 2/3 页 3 CN 115222040 A 3

专利 属性预测模型的训练方法、属性预测方法和装置

专利属性预测模型的训练方法、属性预测方法和装置