说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210875373.8 (22)申请日 2022.07.22 (71)申请人 腾讯科技 (北京) 有限公司 地址 100080 北京市海淀区海淀大街38号 银科大厦16层16 01-1608室 (72)发明人 杨诏 佟建锋 张蔚 石兮若  陈琼  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 杜维 (51)Int.Cl. G06F 16/9535(2019.01) G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 30/02(2012.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型处理方法、 装置、 设备及存 储介质 (57)摘要 本申请公开一种模型处理方法、 装置、 设备 及存储介质, 其相关实施例可应用于人工智能等 场景。 该方法包括: 获取候选样本对以及相应的 样本标注标签; 候选样本对包括候选对象集中的 两个对象标识; 调用待更新的目标模 型根据候选 样本对中各个对象标识对应的对象特征, 分别预 测相应对象标识在目标行为类型下的行为参数 的描述信息; 采用位置预测函数根据预测出的各 个描述信息, 对候选样本对中的两个对象标识在 候选对象集中的位置关系进行预测, 得到目标位 置预测结果; 根据样本标注标签和目标位置预测 结果, 更新目标模型的模型参数, 以得到目标资 讯信息对应的更新后的目标模型; 可以提升模型 的收敛速度, 减少模型的训练时长, 提高模型的 训练效率。 权利要求书4页 说明书28页 附图10页 CN 115130003 A 2022.09.30 CN 115130003 A 1.一种模型处 理方法, 其特 征在于, 包括: 获取候选样本对以及相应的样本标注标签; 所述候选样本对包括候选对象集中的两个 对象标识, 所述样本标注标签是基于所述候选样本对中各个对象标识的目标行为参数确定 的, 任一目标行为参数指示相应对象对目标资讯信息执行的目标行为类型下的反馈行为的 重要度, 所述样本标注标签用于标记所述候选样本对中的两个对象标识在所述候选对象集 中的位置关系; 调用待更新的目标模型根据 所述候选样本对中各个对象标识对应的对象特征, 分别预 测相应对象标识在所述目标 行为类型 下的行为 参数的描述信息; 采用位置预测函数根据 预测出的各个描述信 息, 对所述候选样本对中的两个对象标识 在所述候选对象集中的位置关系进行 预测, 得到目标位置预测结果; 根据所述样本标注标签和所述目标位置预测结果, 更新所述目标模型的模型参数, 以 得到所述 目标资讯信息对应的更新后的目标模型; 其中, 所述 目标资讯信息对应的更新后 的目标模型 所预测出的描述信息, 用于决策 是否将所述目标资 讯信息推送给相应对象。 2.如权利要求1所述的方法, 其特征在于, 所述候选样本对中的第 一个对象标识在所述 候选对象集中的排列位置称为第一排列位置, 所述候选样本对中的第二个对象标识在所述 候选对象集中的排列位置称为第二 排列位置; 所述获取候选样本对以及相应的样本标注标签, 包括: 获取所述候选样本对, 以及所述 候选样本对中各个对象标识的目标 行为参数; 若所述候选样本对中的第 一个对象标识的目标行为参数, 大于所述候选样本对中的第 二个对象标识的目标行为参数, 则将第一标签确定为所述样本标注标签, 所述第一标签用 于指示: 所述第一 排列位置位于所述第二 排列位置之前; 若所述候选样本对中的第 一个对象标识的目标行为参数, 等于所述候选样本对中的第 二个对象标识的目标行为参数, 则将第二标签确定为所述样本标注标签, 所述第二标签用 于指示: 所述第一 排列位置和所述第二 排列位置为同一 位置; 若所述候选样本对中的第 一个对象标识的目标行为参数, 小于所述候选样本对中的第 二个对象标识的目标行为参数, 则将第三标签确定为所述样本标注标签, 所述第三标签用 于指示: 所述第一 排列位置位于所述第二 排列位置之后。 3.如权利要求1或2所述的方法, 其特征在于, 任一对象特征包括N个属性特征, N为正整 数; 所述调用待更新的目标模型根据所述候选样本对中各个对 象标识对应的对 象特征, 分 别预测相应对象标识在所述目标 行为类型 下的行为 参数的描述信息, 包括: 调用所述待更新的目标模型, 分别对所述候选样本对中的第i个对象标识对应的对象 特征中的各个属性特 征进行特征降维处 理, 得到N个中间特 征; i∈[1, 2]; 获取所述N个中间特征中每个中间特征的特征权重; 任一特征权重用于指示相应的中 间特征的重要度; 根据所述每个中间特征以及相应的特征权重, 预测所述第i个对象标识在所述目标行 为类型下的行为 参数的描述信息 。 4.如权利要求3所述的方法, 其特 征在于, 任一中间特 征是一个多维向量; 所述获取 所述N个中间特 征中每个中间特 征的特征权重, 包括: 分别对所述N个中间特征中每个中间特征进行特征挤压处理, 得到N个特征挤压值; 任权 利 要 求 书 1/4 页 2 CN 115130003 A 2一特征挤压值 为一维数值; 根据所述N个中间特征中第n个中间特征对应的特征挤压值与各个特征挤压值之间的 相关性, 确定所述第n个中间特 征的特征权重, n∈[1, N]。 5.如权利要求1所述的方法, 其特征在于, 所述候选样本对中的第 一个对象标识在所述 候选对象集中的排列位置称为第一排列位置, 所述候选样本对中的第二个对象标识在所述 候选对象集中的排列位置称为第二 排列位置; 所述采用位置预测函数根据 预测出的各个描述信 息, 对所述候选样本对中的两个对象 标识在所述 候选对象集中的位置关系进行 预测, 得到目标位置预测结果, 包括: 采用所述位置预测函数根据 所述预测出的各个描述信 息, 对所述第 一排列位置位于所 述第二排列位置之前的概率进 行预测, 得到预测概率; 以及, 将所述预测概率作为所述目标 位置预测结果; 其中, 当所述预测概率大于基准概率时, 指示预测出的位置关系为: 所述第 一排列位置 位于所述第二排列位置之前; 当所述预测概率等于所述基准概率时, 指示预测出 的位置关 系为: 所述第一排列位置和所述第二排列位置为同一位置; 当所述预测 概率小于所述基准 概率时, 指示预测出的位置关系为: 所述第一 排列位置位于所述第二 排列位置之后。 6.如权利要求5所述的方法, 其特征在于, 所述样本标注标签包括数值, 且所述数值处 于预设数值区间内; 任一描述信息包括: 一个用于描述 目标行为类型下 的行为参数 的预测 分值; 所述采用所述位置预测函数根据所述预测出的各个描述信 息, 对所述第 一排列位置位 于所述第二 排列位置之前的概 率进行预测, 得到预测概 率, 包括: 采用所述位置预测函数对所述候选样本对中的第一个对象标识在所述目标行为类型 下的预测分值与第二个对象标识在所述目标行为类型下的预测分值进 行差值运算, 得到差 值运算结果; 将所述差值 运算结果映射至所述预设数值区间中, 得到所述预测概 率。 7.如权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取用于更新初始模型的原始对象集; 所述原始对象集包括: 历史接收到所述目标资 讯信息的多个对象的对象标识; 从所述原始对象集中选取两个对象标识构建原始样本对, 并获取基于所述原始样本对 中各个对象标识的行为标签所得到的原始标注标签; 任一行为标签指示相应对象是否对所 述目标资讯信息执行过反馈行为; 所述原始标注标签指示所述原始样本对中的两个对象标 识在所述原 始对象集中的位置关系; 调用所述初始模型根据 所述原始样本对中各个对象标识对应的对象特征, 分别对相应 对象的行为执行情况进 行预测, 得到相应的行为预测结果; 任一行为预测结果用于指示: 相 应对象对所述目标资 讯信息执 行反馈行为的概 率; 采用所述位置预测函数根据得到的各个行为预测结果, 对所述原始样本对中的两个对 象标识在所述原始对象集中的位置 关系进行预测, 得到所述原始样本对所对应的位置预测 结果; 基于所述原始标注标签和所述原始样本对所对应的位置预测结果更新所述初始模型, 以得到待更新的目标模型。权 利 要 求 书 2/4 页 3 CN 115130003 A 3

.PDF文档 专利 模型处理方法、装置、设备及存储介质

文档预览
中文文档 43 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共43页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型处理方法、装置、设备及存储介质 第 1 页 专利 模型处理方法、装置、设备及存储介质 第 2 页 专利 模型处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:32:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。