说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111473771.9 (22)申请日 2021.11.30 (71)申请人 杭州网易云音乐科技有限公司 地址 310052 浙江省杭州市萧 山区钱江世 纪城奔竞大道353号杭州国际博览中 心A座1201室 (72)发明人 许鹏飞 李永刚 马雨浩 郑磊 蒋能学 郑玮 (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 代理人 董晓盈 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 16/9535(2019.01) (54)发明名称 特征处理方法、 装置、 计算设备及 介质 (57)摘要 本公开的实施方式提供了一种特征处理方 法、 装置、 计算设备及介质, 属于机器学习技术领 域。 本公开通过获取第一离线模 型和用于训练第 一离线模型的至少一个第一离线特征, 从而在获 取到对应于至少一个第一在线特征的在线样本 数据后, 基于至少一个第一离线特征来确定是否 允许第一在线特征进入模型的训练过程, 进而在 至少一个第一离线特征中存在第一在线特征的 情况下, 将第一在线特征确定为用于训练第一离 线模型的在线训练特征。 通过上述过程, 使得无 需对在线样本数据进行累积即可实现特征准入, 从而能够保证模型训练的实时性。 权利要求书2页 说明书14页 附图4页 CN 114139727 A 2022.03.04 CN 114139727 A 1.一种特 征处理方法, 其特 征在于, 所述方法包括: 获取第一离线模型和用于训练所述第一离线模型的至少一个第一离线特 征; 获取在线样本数据, 所述在线样本数据对应于 至少一个第一在线特 征; 在所述至少一个第 一离线特征中存在所述第 一在线特征的情况下, 将所述第 一在线特 征确定为用于训练所述第一离线模型的在线训练特 征。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 在所述至少一个第 一离线特征中不存在所述第 一在线特征的情况下, 获取所述第 一在 线特征的出现次数; 在所述第一在线特征的出现次数大于设定次数阈值的情况下, 将所述第 一在线特征确 定为用于训练所述第一离线模型的在线训练特 征。 3.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一在线特征确定为用于训练 所述第一离线模型的在线训练特 征之后, 所述方法还 包括: 将所述第一在线特征添加至第 一特征队列, 所述第 一特征队列用于存储训练所述第 一 离线模型的在线训练特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述第一离线模型对应有第一起始时间 戳, 所述第一 起始时间戳用于指示 开始从所述第一特 征队列中获取在线训练特 征的时间; 所述将所述第 一在线特征确定为用于训练所述第 一离线模型的在线训练特征之后, 所 述方法还 包括: 从所述第一特征队列中, 获取对应时间位于所述第一起始时间戳之后的在线训练特 征; 基于所述对应时间位于所述第 一起始时间戳之后的在线训练特征, 训练所述第 一离线 模型, 得到第一在线模型。 5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取第二离线模型和用于训练所述第 二离线模型的至少一个第 二离线特征, 所述第 二 离线模型对应有第二截止时间戳, 所述第二截止时间戳用于指示离线训练所述第二离线模 型时所使用的离线样本数据的数据截止时间, 所述第二离线模型关联有第二特征队列, 所 述第二离线模型对应有第二起始时间戳, 所述第二起始时间戳用于指示开始从所述第二特 征队列中获取在线训练特 征的时间; 基于对应时间位于所述第 二截止时间戳与 所述第二起始时间戳之间的在线训练特征, 训练所述第二离线模型, 得到待训练的第二在线模型。 6.根据权利要求5所述的方法, 其特征在于, 所述基于对应时间位于所述第 二截止时间 戳与所述第二起始 时间戳之间的在线训练特征, 训练所述第二离线模型, 得到待训练的第 二在线模型之后, 所述方法还 包括: 从所述第二特征队列中, 获取对应时间位于所述第二起始时间戳之后的在线训练特 征; 基于所述对应时间位于所述第 二起始时间戳之后的在线训练特征, 训练所述待训练 的 第二在线模型, 得到第二在线模型。 7.根据权利要求1至6中任一项所述的方法, 其特征在于, 不同的离线模型对应于不同 的版本信息;权 利 要 求 书 1/2 页 2 CN 114139727 A 2所述方法还 包括: 响应于接收到模型获取指令, 获取所述模型获取指令对应的版本信 息所指示的离线模 型。 8.一种特 征处理装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取第 一离线模型和用于训练所述第 一离线模型的至少一个第 一离线 特征; 所述获取模块, 还用于获取在线样本数据, 所述在线样本数据对应于至少一个第一在 线特征; 确定模块, 用于在所述至少一个第一离线特征中存在所述第一在线特征的情况下, 将 所述第一在线特 征确定为用于训练所述第一离线模型的在线训练特 征。 9.一种计算设备, 其特征在于, 所述计算设备包括存储器、 处理器及存储在存储器上并 可在处理器上运行 的计算机程序, 其中, 所述处理器执行所述程序时实现如权利要求1至7 中任一项所述的特 征处理方法所 执行的操作。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有程序, 所述程序被处 理器执行如权利要求1至7中任一项所述的特 征处理方法所 执行的操作。权 利 要 求 书 2/2 页 3 CN 114139727 A 3
专利 特征处理方法、装置、计算设备及介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 01:22:26
上传分享
举报
下载
原文档
(551.1 KB)
分享
友情链接
DB22-T 2445-2016 节能技术改造及合同能源管理项目节能量审核与计算方法第1部分 照明系统 吉林省.pdf
T-CASME 661—2023 绿色建筑节能设计技术文件编制规范.pdf
T-ZSFX 002—2019 中山装手工制作生产规范.pdf
GB-T 15843.4-2024 信息技术 安全技术 实体鉴别 第4部分:采用密码校验函数的机制.pdf
DB37-T 5239-2022 《节水型企业(单位)评价标准》 山东省.pdf
思度安全-DSMM-019 数据安全事件应急管理规范V1.0.pdf
GB-T 15843.6-2018 信息技术 安全技术 实体鉴别 第6部分:采用人工数据传递的机制.pdf
DB31-T 1311-2021 上海市 数据去标识化共享指南 .pdf
腾讯安全 物联网汽车安全.pdf
GB-T 20530-2006 文献档案资料数字化工作导则.pdf
绿盟 赵粮 大模型浪潮下的全球网络安全思考-2023TechWorld-final.pdf
GB-T 20274.2-2008 信息安全技术 信息系统安全保障评估框架 第2部分:技术保障.pdf
SN-T 1657.1-2007 进出口电动工具检验规程 第1部分:通用要求.pdf
T-WCGH 002—2022 武夷岩茶冲泡品鉴茶具.pdf
“安全需要每个工程师的参与”-DevSecOps理念及思考.pdf
T-CNHAW 0011—2024 干眼诊疗中心分级建设要求.pdf
法律法规 中华人民共和国技术进出口管理条例2020-11-29.pdf
法律法规 唐山市人民代表大会常务委员会关于第二批废止地方性法规中若干行政许可规定的决定.pdf
YD-T 4118-2022 分布式运营级网络地址翻译(NAT)的集中备份技术要求.pdf
GB-T51431-2020 5-移动通信基站工程技术标准 GBT 51431-2020.pdf
1
/
3
21
评价文档
赞助1.5元 点击下载(551.1 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。