说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210674793.X (22)申请日 2022.06.14 (71)申请人 阿里云计算有限公司 地址 310000 浙江省杭州市西湖区转塘科 技经济区块12号 (72)发明人 孟子豪  (74)专利代理 机构 广州铸智知识产权代理有限 公司 44886 专利代理师 徐瑞红 (51)Int.Cl. G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 标签处理方法、 装置、 电子设备和计算机可 读存储介质 (57)摘要 本申请提出一种标签处理方法、 装置、 电子 设备和计算机可读存储介质。 该方法包括: 确定 第一用户行为序列; 其中, 第一用户行为序列包 括用户连续处理的多个内容; 基于多个内容对应 的多个标签, 确定多个标签跳转关系; 基于多个 标签跳转关系, 确定第一图谱信息。 本申请实施 例将用户行为信息融入 标签图谱的构建过程, 可 以充分挖掘标签 之间的相关性, 从而提升图谱信 息的准确度。 权利要求书2页 说明书17页 附图3页 CN 114970548 A 2022.08.30 CN 114970548 A 1.一种标签处 理方法, 包括: 确定第一用户行为序列; 其中, 所述第一用户行为序列包括用户连续处 理的多个内容; 基于所述多个内容对应的多个标签, 确定多个标签跳转关系; 基于所述多个标签跳转关系, 确定第一图谱信息 。 2.根据权利要求1所述的方法, 其中, 所述方法还 包括: 基于用户处理的第 一内容的标签以及所述第 一图谱信 息, 确定向所述用户推荐的第 二 内容。 3.根据权利要求1或2所述的方法, 其中, 所述确定第一用户行为序列, 包括: 在第一内容 集合所关联的多个用户行为序列中, 选取第二用户行为序列; 利用预设长度的时间滑窗在所述第二用户行为序列中确定至少一个子序列; 其中, 所 述至少一个子序列包括所述第一用户行为序列; 所述基于所述多个标签跳转关系, 确定第一图谱信息, 包括: 将所述多个标签跳转关系添加到所述第一内容 集合对应的标签跳转关系集 合中; 基于所述标签跳转关系集 合, 确定与所述第一内容 集合对应的第一图谱信息 。 4.根据权利要求3所述的方法, 其中, 所述基于所述标签跳转关系集合, 确定与所述第 一内容集合对应的第一图谱信息, 包括: 基于所述标签跳转关系集合, 得到第二图谱信息; 其中, 所述第二图谱信息包括与Y个 标签对应的Y组跳转次数; 其中, 所述Y组跳转次数中的第i组跳转次数包括所述Y个标签中 的第i个标签与其他各标签之 间的跳转次数, Y为大于或等于1的整 数, i为小于或等于Y的正 整数; 基于预设次数阈值对所述第二图谱信息进行处 理, 得到所述第一图谱信息 。 5.根据权利要求1或2所述的方法, 其中, 所述方法还 包括: 确定第一内容 集合对应的多个标签两 两之间的共现次数; 基于所述共现次数, 确定第三图谱信息; 其中, 所述第三图谱信息包括与X个标签对应 的X组共现次数; 其中, 所述X组共现次数中的第 j组共现次数包括所述X个标签中的第 j个标 签与其他各标签的共现次数, X为大于或等于1的整数, j为小于或等于X的正整数; 基于所述第 一图谱信 息和所述第 三图谱信 息, 得到所述第 一内容集合对应的第四图谱 信息。 6.根据权利要求5所述的方法, 其中, 所述基于所述第一图谱信息和所述第三图谱信 息, 得到所述第一内容 集合对应的第四图谱信息, 包括: 基于所述第一图谱信息、 所述第三图谱信息以及预设的随机搜索概率, 确定所述第一 内容集合对应的多个标签两 两之间的关联概 率; 基于所述多个标签两 两之间的关联概 率, 确定所述多个标签中各 标签的权 重信息; 基于所述各 标签的权 重信息, 得到所述第四图谱信息 。 7.根据权利要求6所述的方法, 其中, 所述基于所述多个标签两两之间的关联概率, 确 定所述多个标签中各 标签的权 重信息, 包括: 基于初始的权重向量以及所述多个标签两两之间的关联概率进行多次迭代, 得到所述 各标签的权 重信息; 其中, 所述多次迭代中的第t次迭代包括:权 利 要 求 书 1/2 页 2 CN 114970548 A 2基于第t个权重向量以及概率矩阵, 得到第t+1个权重向量; 其中, 所述概率矩阵用于表 征所述多个标签两 两之间的关联概 率; 在所述第t+1个权重向量符合预设条件的情况下, 基于所述第t+1个权重向量得到所述 各标签的权 重信息, 其中, t为大于或等于1的整数。 8.根据权利要求6所述的方法, 其中, 所述基于所述各标签的权重信息, 得到所述第 四 图谱信息, 包括: 基于所述各 标签的权 重信息对所述第三图谱信息进行处 理, 得到所述第四图谱信息 。 9.根据权利要求6所述的方法, 其中, 所述方法还 包括: 基于所述各 标签的权 重信息以及所述第四图谱信息, 确定多个标签序列; 基于所述多个标签序列以及词向量生成模型, 对所述多个标签中各标签的初始化表征 向量进行处 理, 得到所述各 标签的目标表征向量。 10.根据权利要求9所述的方法, 其中, 所述方法还 包括: 基于所述多个标签中的第 一标签的目标表征向量以及深度 学习模型, 对所述第 一标签 对应的内容或实体进行处 理, 得到所述内容或实体对应的预测信息 。 11.根据权利要求9所述的方法, 其中, 基于所述各标签的权重信息以及所述第四图谱 信息, 确定多个标签序列, 包括: 基于所述各 标签的权 重信息, 在所述多个标签中选取初始标签; 基于所述初始标签以及所述第四图谱信息, 在所述多个标签中选择多个游走 标签; 基于所述初始标签以及所述多个游走标签, 得到所述多个标签序列中的第一标签序 列。 12.一种标签处 理装置, 包括: 序列确定模块, 用于确定第 一用户行为序列; 其中, 所述第 一用户行为序列包括用户连 续处理的多个内容; 跳转确定模块, 用于基于所述多个内容对应的多个标签, 确定多个标签跳转关系; 第一图谱确定模块, 用于基于所述多个标签跳转关系, 确定第一图谱信息 。 13.一种电子设备, 包括存储器、 处理器及存储在存储器上的计算机程序, 所述处理器 在执行所述计算机程序时实现权利要求1 ‑11中任一项所述的方法。 14.一种计算机可读存储介质, 所述计算机可读存储介质内存储有计算机程序, 所述计 算机程序被处 理器执行时实现权利要求1 ‑11中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114970548 A 3

.PDF文档 专利 标签处理方法、装置、电子设备和计算机可读存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 标签处理方法、装置、电子设备和计算机可读存储介质 第 1 页 专利 标签处理方法、装置、电子设备和计算机可读存储介质 第 2 页 专利 标签处理方法、装置、电子设备和计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。