专利模型处理方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210875373.8 (22)申请日 2022.07.22 (71)申请人腾讯科技（北京）有限公司地址 100080 北京市海淀区海淀大街38号银科大厦16层16 01－1608室 (72)发明人杨诏　佟建锋　张蔚　石兮若　陈琼　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师杜维 (51)Int.Cl. G06F 16/9535(2019.01) G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 30/02(2012.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称模型处理方法、装置、设备及存储介质 (57)摘要本申请公开一种模型处理方法、装置、设备及存储介质，其相关实施例可应用于人工智能等场景。该方法包括：获取候选样本对以及相应的样本标注标签；候选样本对包括候选对象集中的两个对象标识；调用待更新的目标模型根据候选样本对中各个对象标识对应的对象特征，分别预测相应对象标识在目标行为类型下的行为参数的描述信息；采用位置预测函数根据预测出的各个描述信息，对候选样本对中的两个对象标识在候选对象集中的位置关系进行预测，得到目标位置预测结果；根据样本标注标签和目标位置预测结果，更新目标模型的模型参数，以得到目标资讯信息对应的更新后的目标模型；可以提升模型的收敛速度，减少模型的训练时长，提高模型的训练效率。权利要求书4页说明书28页附图10页 CN 115130003 A 2022.09.30 CN 115130003 A 1.一种模型处理方法，其特征在于，包括：获取候选样本对以及相应的样本标注标签；所述候选样本对包括候选对象集中的两个对象标识，所述样本标注标签是基于所述候选样本对中各个对象标识的目标行为参数确定的，任一目标行为参数指示相应对象对目标资讯信息执行的目标行为类型下的反馈行为的重要度，所述样本标注标签用于标记所述候选样本对中的两个对象标识在所述候选对象集中的位置关系；调用待更新的目标模型根据所述候选样本对中各个对象标识对应的对象特征，分别预测相应对象标识在所述目标行为类型下的行为参数的描述信息；采用位置预测函数根据预测出的各个描述信息，对所述候选样本对中的两个对象标识在所述候选对象集中的位置关系进行预测，得到目标位置预测结果；根据所述样本标注标签和所述目标位置预测结果，更新所述目标模型的模型参数，以得到所述目标资讯信息对应的更新后的目标模型；其中，所述目标资讯信息对应的更新后的目标模型所预测出的描述信息，用于决策是否将所述目标资讯信息推送给相应对象。 2.如权利要求1所述的方法，其特征在于，所述候选样本对中的第一个对象标识在所述候选对象集中的排列位置称为第一排列位置，所述候选样本对中的第二个对象标识在所述候选对象集中的排列位置称为第二排列位置；所述获取候选样本对以及相应的样本标注标签，包括：获取所述候选样本对，以及所述候选样本对中各个对象标识的目标行为参数；若所述候选样本对中的第一个对象标识的目标行为参数，大于所述候选样本对中的第二个对象标识的目标行为参数，则将第一标签确定为所述样本标注标签，所述第一标签用于指示：所述第一排列位置位于所述第二排列位置之前；若所述候选样本对中的第一个对象标识的目标行为参数，等于所述候选样本对中的第二个对象标识的目标行为参数，则将第二标签确定为所述样本标注标签，所述第二标签用于指示：所述第一排列位置和所述第二排列位置为同一位置；若所述候选样本对中的第一个对象标识的目标行为参数，小于所述候选样本对中的第二个对象标识的目标行为参数，则将第三标签确定为所述样本标注标签，所述第三标签用于指示：所述第一排列位置位于所述第二排列位置之后。 3.如权利要求1或2所述的方法，其特征在于，任一对象特征包括N个属性特征， N为正整数；所述调用待更新的目标模型根据所述候选样本对中各个对象标识对应的对象特征，分别预测相应对象标识在所述目标行为类型下的行为参数的描述信息，包括：调用所述待更新的目标模型，分别对所述候选样本对中的第i个对象标识对应的对象特征中的各个属性特征进行特征降维处理，得到N个中间特征； i∈[1， 2]；获取所述N个中间特征中每个中间特征的特征权重；任一特征权重用于指示相应的中间特征的重要度；根据所述每个中间特征以及相应的特征权重，预测所述第i个对象标识在所述目标行为类型下的行为参数的描述信息。 4.如权利要求3所述的方法，其特征在于，任一中间特征是一个多维向量；所述获取所述N个中间特征中每个中间特征的特征权重，包括：分别对所述N个中间特征中每个中间特征进行特征挤压处理，得到N个特征挤压值；任权　利　要　求　书 1/4 页 2 CN 115130003 A 2一特征挤压值为一维数值；根据所述N个中间特征中第n个中间特征对应的特征挤压值与各个特征挤压值之间的相关性，确定所述第n个中间特征的特征权重， n∈[1， N]。 5.如权利要求1所述的方法，其特征在于，所述候选样本对中的第一个对象标识在所述候选对象集中的排列位置称为第一排列位置，所述候选样本对中的第二个对象标识在所述候选对象集中的排列位置称为第二排列位置；所述采用位置预测函数根据预测出的各个描述信息，对所述候选样本对中的两个对象标识在所述候选对象集中的位置关系进行预测，得到目标位置预测结果，包括：采用所述位置预测函数根据所述预测出的各个描述信息，对所述第一排列位置位于所述第二排列位置之前的概率进行预测，得到预测概率；以及，将所述预测概率作为所述目标位置预测结果；其中，当所述预测概率大于基准概率时，指示预测出的位置关系为：所述第一排列位置位于所述第二排列位置之前；当所述预测概率等于所述基准概率时，指示预测出的位置关系为：所述第一排列位置和所述第二排列位置为同一位置；当所述预测概率小于所述基准概率时，指示预测出的位置关系为：所述第一排列位置位于所述第二排列位置之后。 6.如权利要求5所述的方法，其特征在于，所述样本标注标签包括数值，且所述数值处于预设数值区间内；任一描述信息包括：一个用于描述目标行为类型下的行为参数的预测分值；所述采用所述位置预测函数根据所述预测出的各个描述信息，对所述第一排列位置位于所述第二排列位置之前的概率进行预测，得到预测概率，包括：采用所述位置预测函数对所述候选样本对中的第一个对象标识在所述目标行为类型下的预测分值与第二个对象标识在所述目标行为类型下的预测分值进行差值运算，得到差值运算结果；将所述差值运算结果映射至所述预设数值区间中，得到所述预测概率。 7.如权利要求1所述的方法，其特征在于，所述方法还包括：获取用于更新初始模型的原始对象集；所述原始对象集包括：历史接收到所述目标资讯信息的多个对象的对象标识；从所述原始对象集中选取两个对象标识构建原始样本对，并获取基于所述原始样本对中各个对象标识的行为标签所得到的原始标注标签；任一行为标签指示相应对象是否对所述目标资讯信息执行过反馈行为；所述原始标注标签指示所述原始样本对中的两个对象标识在所述原始对象集中的位置关系；调用所述初始模型根据所述原始样本对中各个对象标识对应的对象特征，分别对相应对象的行为执行情况进行预测，得到相应的行为预测结果；任一行为预测结果用于指示：相应对象对所述目标资讯信息执行反馈行为的概率；采用所述位置预测函数根据得到的各个行为预测结果，对所述原始样本对中的两个对象标识在所述原始对象集中的位置关系进行预测，得到所述原始样本对所对应的位置预测结果；基于所述原始标注标签和所述原始样本对所对应的位置预测结果更新所述初始模型，以得到待更新的目标模型。权　利　要　求　书 2/4 页 3 CN 115130003 A 3

专利 模型处理方法、装置、设备及存储介质

专利模型处理方法、装置、设备及存储介质