说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210879482.7 (22)申请日 2022.07.25 (71)申请人 北京有竹居网络技 术有限公司 地址 101299 北京市平谷区林荫北街13号 信息大厦802室 申请人 脸萌有限公司 (72)发明人 佘琪 杨辰杰 张宇 卢靓妮  (74)专利代理 机构 北京信远 达知识产权代理有 限公司 1 1304 专利代理师 贾小慧 (51)Int.Cl. G06F 30/20(2020.01) G06K 9/62(2022.01) G06F 119/02(2020.01) (54)发明名称 一种训练样 本获取方法、 转化率预估模型生 成方法及装置 (57)摘要 本申请公开了一种训练样 本获取方法、 转化 率预估模型生 成方法及装置, 其中, 方法包括: 当 获取第一训练样本集合后, 将第一训练样本集合 中的负样本以及时间特征输入打散模型。 其中, 时间特征是基于第一训练样本集合中的正样本 的回流时间确定的, 打散模型为预先训练的, 用 于确定负样 本在时间上的分布情况, 将根据负样 本以及时间特征确定负样本的时间分布。 在确定 负样本的时间分布后, 将根据该时间分布确定第 二训练样 本集合, 从而确定的第二训练样本集合 中的正样 本和负样本的比例符合预设条件。 由于 本申请在确定负样本的时间分布时参考了正样 本的回流时间, 从而可以对负样 本的分布进行准 确打散, 提高正负 样本分布比例的稳定性。 权利要求书2页 说明书9页 附图3页 CN 115130325 A 2022.09.30 CN 115130325 A 1.一种训练样本获取 方法, 其特 征在于, 所述方法包括: 获取第一训练样本集合, 所述第一训练样本集合包括正样本和负样本, 所述正样本是 指点击后发生 转化行为的样本, 所述负 样本为点击后未发生 转化行为的样本; 将所述负样本以及时间特征输入打散模型, 获取所述打散模型输出的所述负样本对应 的时间分布, 所述时间特征是基于所述正样本的回流时间确定的, 所述打散模型为预先训 练的, 用于确定所述负 样本的时间分布; 根据所述 时间分布确定第 二训练样本集合, 所述第 二训练样本集合中的正样本和负样 本的比例符合预设条件。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 根据所述 正样本的回流时间确定所述时间特 征。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述正样本的回流 时间确定所述 时间特征, 包括: 对所述正样本的回流时间进行编码获得 所述时间特 征; 或, 针对任一回流时间, 根据所述回流时间以及正弦函数确定多个第一 参数; 将所述多个第一 参数进行加权求和, 获取 所述时间特 征。 4.根据权利要求1所述的方法, 其特征在于, 所述打散模型与 所述正样本对应的转化行 为相关。 5.根据权利要求4所述的方法, 其特征在于, 所转化行为包括激活行为、 下载行为或消 费行为。 6.根据权利要求1所述的方法, 其特征在于, 所述打散模型为wide&deep模型, 所述 wide&deep模型中w ide部分处 理所述时间特 征、 deep部分处 理所述负 样本。 7.一种转 化率预估模型生成方法, 其特 征在于, 所述方法包括: 获取训练样本集合, 所述训练样本集合是基于所述权利要求1 ‑6任一项所述的方法获 取的, 所述训练样本集合中正样本和负样本的比例符合预设条件, 所述正样本是指点击后 发生转化行为的样本, 所述负 样本为点击后未发生 转化行为的样本; 利用所述训练样本集 合对初始模型进行训练, 生成转 化率预估模型。 8.一种训练样本获取装置, 其特 征在于, 所述装置包括: 第一获取单元, 用于获取第一训练样本集合, 所述第一训练样本集合包括正样本和负 样本, 所述正样本是指点击后发生转化行为的样本, 所述负样本为点击后未发生转化行为 的样本; 第二获取单元, 用于将所述负样本以及时间特征输入打散模型, 获取所述打散模型输 出的所述负样本对应的时间分布, 所述时间特征是基于所述正样本的回流时间确定的, 所 述打散模型为预 先训练的, 用于确定所述负 样本的时间分布; 确定单元, 用于根据所述时间分布确定第二训练样本集合, 所述第二训练样本集合中 的正样本和负 样本的比例符合预设条件。 9.一种转 化率预估模型生成装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取训练样本集合, 所述训练样本集合是基于所述权利要求1 ‑6任一项 所述的方法获取 的, 所述训练样本集合中正样本和负样本的比例符合预设条件, 所述正样 本是指点击后发生 转化行为的样本, 所述负 样本为点击后未发生 转化行为的样本;权 利 要 求 书 1/2 页 2 CN 115130325 A 2生成单元, 用于利用所述训练样本集 合对初始模型进行训练, 生成转 化率预估模型。 10.一种电子设备, 其特 征在于, 所述设备包括: 处 理器和存 储器; 所述存储器, 用于存 储指令或计算机程序; 所述处理器, 用于执行所述存储器中的所述指令或计算机程序, 以使得所述电子设备 执行权利要求1 ‑7任一项所述的方法。 11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有指令, 当所述指令在设备 上运行时, 使得 所述设备 执行权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115130325 A 3

.PDF文档 专利 一种训练样本获取方法、转化率预估模型生成方法及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种训练样本获取方法、转化率预估模型生成方法及装置 第 1 页 专利 一种训练样本获取方法、转化率预估模型生成方法及装置 第 2 页 专利 一种训练样本获取方法、转化率预估模型生成方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:47:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。