(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111675687.5
(22)申请日 2021.12.31
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 张绍亮 谢若冰 王瑞 杨智鸿
夏锋 林乐宇
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
代理人 杜维
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9035(2019.01)
G06F 16/9038(2019.01)
G06F 16/906(2019.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
数据处理方法、 设备及可读存 储介质
(57)摘要
本申请公开了一种数据处理方法、 设备及可
读存储介质, 该方法包括: 获取第一样本对象针
对每个第一样本媒体数据分别对应的通用属性
特征以及第一未来属性特征, 在初始判别器中根
据通用属性特征以及第一未来属性特征, 输出第
一样本对象针对每个第一样本媒体数据的第一
触发概率, 在初始判别器中输出针对由初始生成
器所提供的候选样本媒体数据的第二触发概率;
根据第一触发概率和第二触发概率, 调整初始对
抗网络的模型参数, 得到目标对抗网络。 采用本
申请, 可以减少概率预测模型的运行时间以及提
高推荐的候选媒体数据质量。 本申请实施例可应
用于云技术、 人工智能、 智慧交通、 辅助驾驶等各
种场景。
权利要求书3页 说明书24页 附图11页
CN 114357301 A
2022.04.15
CN 114357301 A
1.一种数据处 理方法, 其特 征在于, 包括:
根据第一样本对象相关联的第一历史触发属性信息以及至少两个第一样本媒体数据
分别对应的媒体属性信息, 确定所述第一样本对象针对每个第一样本媒体数据分别对应的
通用属性特 征;
获取所述第 一样本对象在未来 时刻下, 与 所述第一历史触发属性信 息相关联的第 一未
来属性特 征;
通过初始对抗网络中的初始生成器在至少两个第二样本媒体数据中筛选出候选样本
媒体数据, 所述初始 生成器将所述候选样本媒体数据发送至所述初始对抗网络中的初始判
别器;
在所述初始判别器中, 根据 所述第一样本对象针对每个第 一样本媒体数据分别对应的
通用属性特征以及所述第一未来属性特征, 输出所述第一样本对象针对每个第一样本媒体
数据的第一触发概率, 在所述初始判别器中输出针对所述候选样本媒体数据的第二触发概
率;
根据所述第一触发概率和所述第二触发概率, 调整所述初始对抗网络的模型参数, 得
到目标对抗网络, 将所述 目标对抗网络中的目标生成器, 确定为用于预测目标对 象针对媒
体数据的触发概 率的概率预测模型。
2.根据权利要求1所述的方法, 其特征在于, 所述至少两个第 一样本媒体数据包括第 一
样本媒体数据Si, i 为正整数; 所述方法还 包括:
将所述第一样本对象的对象属性信 息、 所述第 一样本对象的触发记录信 息以及历史触
发第一样本媒体数据的分发环境信息, 确定为所述第一样本对象相关联的第一历史触发属
性信息; 所述历史触发第一样本媒体数据为所述触发记录信息中所记录的第一样本媒体数
据;
将所述第 一样本媒体数据Si的媒体数据标签、 媒体数据内容类别以及媒体数据场景类
别, 确定为所述第一样本媒体数据Si对应的媒体属性信息 。
3.根据权利要求1所述的方法, 其特征在于, 所述通过初始对抗网络 中的初始生成器在
至少两个第二样本媒体数据中筛 选出候选样本媒体数据, 包括:
根据第二样本对象相关联的第二历史触发属性信息以及至少两个第二样本媒体数据
分别对应的媒体属性信息, 确定所述第二样本对象针对每个第二样本媒体数据分别对应的
通用属性特 征;
将所述第二样本对象针对每个第 二样本媒体数据分别对应的通用属性特征, 输入所述
初始对抗网络中的初始 生成器, 通过所述初始 生成器生成所述第二样本对象针对所述每个
第二样本媒体数据分别对应的第一 生成触发概 率;
根据所述第二历史触发属性信息, 从所述至少两个第二样本媒体数据中筛选出S个匹
配样本; 所述S个匹配样本为所述第二样本对象未触发过的第二样本媒体数据; S为 正整数;
根据所述第一生成触发概率对所述S个匹配样本进行排序, 得到排序后的S个匹配样
本, 从所述排序后的S个匹配样本中获取K个匹配样本, 作为候选样本媒体数据; 所述K为小
于或等于S的正整数。
4.根据权利要求1所述的方法, 其特征在于, 所述初始判别器包括特征卷积层、 神经网
络感知层与全连接 激活层;权 利 要 求 书 1/3 页
2
CN 114357301 A
2所述在所述初始判别器中, 根据所述第 一样本对象针对所述候选样本媒体数据对应的
通用属性特征以及所述第一未来属性特征, 输出所述第一样本对象针对所述第一样本媒体
数据的第一触发概 率, 包括:
通过所述特征卷积层对所述第一样本对象针对所述第一样本媒体数据对应的通用属
性特征以及所述第一未来属 性特征进行卷积融合处理, 得到第一样本卷积 融合特征, 将所
述第一样本卷积融合特 征输入所述神经网络感知 层;
通过所述神经网络感知层对所述第 一样本卷积融合特征进行加权转换处理, 得到所述
第一样本卷积融合特 征对应的待激活特 征, 将所述待激活特 征输入所述全连接 激活层;
通过所述全连接激活层对所述待激活特征进行激活处理, 得到所述第 一样本对象针对
所述第一样本媒体数据的第一触发概 率。
5.根据权利要求3所述的方法, 其特征在于, 所述在所述初始判别器中输出针对所述候
选样本媒体数据的第二触发概 率, 包括:
获取所述第 二样本对象在未来 时刻下, 与 所述第二历史触发属性信 息相关联的第 二未
来属性特 征;
在所述初始判别器中, 根据 所述第二样本对象针对所述候选样本媒体数据对应的通用
属性特征以及所述第二未来属性特征, 输出所述第二样本对象针对所述候选样本媒体数据
的第二触发概 率。
6.根据权利要求1所述的方法, 其特征在于, 所述根据所述第 一触发概率和所述第 二触
发概率, 调整所述初始对抗网络的模型参数, 得到目标对抗网络, 包括:
根据所述第 一触发概率以及针对所述第 一样本媒体数据的真实触发标签, 确定针对所
述第一样本媒体数据的第一损失值;
根据所述第二触发概 率确定针对所述 候选样本媒体数据的第二损失值;
根据对抗判别损 失函数、 所述第一损 失值以及所述第二损 失值, 对所述初始判别器的
模型参数进行调整;
根据对抗生成损 失函数、 所述第一损 失值以及所述第二损 失值, 对所述初始生成器的
模型参数进行调整;
根据调整后的初始判别器以及调整后的初始生成器, 生成目标对抗网络 。
7.根据权利要求6所述的方法, 其特征在于, 所述根据调整后的初始判别器以及调 整后
的初始生成器, 生成目标对抗网络, 包括:
根据第二样本对象相关联的第二历史触发属性信息以及至少两个第二样本媒体数据
分别对应的媒体属性信息, 确定所述第二样本对象针对每个第二样本媒体数据分别对应的
通用属性特 征;
将所述第二样本对象针对每个第 二样本媒体数据分别对应的通用属性特征, 输入所述
初始生成器, 通过所述初始 生成器生成所述第二样本对象针对所述每个第二样本媒体数据
分别对应的第一 生成触发概 率;
根据所述第 一生成触发概率以及针对所述第 二样本媒体数据的真实触发标签, 确定针
对所述第二样本媒体数据的第三损失值;
根据监督损失函数以及所述第 三损失值, 对所述调整后的初始生成器的模型参数进行
调整, 得到目标生成器, 将所述 目标生成器和所述调整后的初始判别器确定为目标对抗网权 利 要 求 书 2/3 页
3
CN 114357301 A
3
专利 数据处理方法、设备及可读存储介质
文档预览
中文文档
39 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共39页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 00:20:13上传分享