说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210638768.6 (22)申请日 2022.06.07 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 马圣杰 瞿康 刘丽 阳锋  (74)专利代理 机构 北京英赛 嘉华知识产权代理 有限责任公司 1 1204 专利代理师 王达佐 马晓亚 (51)Int.Cl. G06Q 30/02(2012.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06F 40/30(2020.01) (54)发明名称 落地页特征生 成方法、 落地页搜索方法及相 关装置 (57)摘要 本公开提供了一种落地页特征生 成方法、 落 地页搜索方法及相关装置, 涉及数据搜索、 深度 学习等人工智能技术领域。 该方法包括: 从用户 的搜索会话中提取出会话内不同查询词之间的 第一对应关系, 以及查询词、 相关词、 落地页三者 中任意两者之间的第二对应关系; 构建由查询 词、 相关词、 落地页的语义特征充当节点、 第一对 应关系和第二对应关系充当节点之间的边的原 始节点关联图; 基于随机游走算法对原始节点关 联图进行节 点邻域采样, 并通过对采样结果进行 迭代更新得到目标节点关联图; 利用预设的图神 经网络处理目标节点关联图, 得到目标落地页特 征。 应用该方法可使落地页特征在语义特征的基 础上具有知识推理和认知关联的能力。 权利要求书3页 说明书11页 附图5页 CN 114926223 A 2022.08.19 CN 114926223 A 1.一种落 地页特征生成方法, 包括: 从用户的搜索会话中提取出会话内不同查询词之间的第一对应关系, 以及查询词、 相 关词、 落地页三者中任意两者之间的第二对应关系; 构建由所述查询词、 所述相关词、 所述落地页的语义特征充当节点、 所述第 一对应关系 和所述第二对应关系充当节点之间的边的原 始节点关联图; 基于随机游走算法对所述原始节点关联图进行节点邻域采样, 并通过对采样结果进行 迭代更新得到目标节点关联图; 利用预设的图神经网络处 理所述目标节点关联图, 得到目标落 地页特征。 2.根据权利要求1所述的方法, 其中, 所述从用户的搜索会话中提取出会话内不同查询 词之间的第一对应关系, 以及查询词、 相关词、 落地页三者中任意两者之间的第二对应关 系, 包括: 将用户的搜索会话中相邻 输入的两个不同查询词之间的关系, 确定为所述第 一对应关 系; 将用户的搜索会话中分别提取出查询词与相关词之间的关系、 查询词与落地页之间的 关系、 相关词与落 地页之间的关系, 得到所述第二对应关系。 3.根据权利要求1所述的方法, 其中, 所述构建由所述查询词、 所述相关词、 所述落地页 的语义特征充当节点、 所述第一对应关系和所述第二对应关系充当节点之 间的边的原始节 点关联图, 包括: 以构建无向无权图的方式, 构建由所述查询词、 所述相关词、 所述落地页的语义特征充 当节点、 所述第一对应关系和所述第二对应关系充当节点之间的边的原 始无向无权图; 对应的, 所述基于随机游走算法对所述原始节点关联图进行节点邻域采样, 并通过对 采样结果进行迭代更新得到目标节点关联图, 包括: 基于随机游走算法对所述原始无向无权图进行节点邻域采样, 并通过对采样结果进行 迭代更新得到所述目标节点关联图。 4.根据权利要求1所述的方法, 其中, 所述基于随机游走算法对所述原始节点关联图进 行节点邻域采样, 并通过对 采样结果进行迭代更新得到目标节点关联图, 包括: 初始化所述原 始节点关联图中各节点间的相关性, 得到原 始相关性数值; 基于随机游走算法迭代更新所述原 始相关性数值, 得到更新后相关性数值; 将与所述更新后相关性数值对应的节点关联图, 确定为所述目标节点关联图。 5.根据权利要求1 ‑4任一项所述的方法, 其中, 所述利用预设的图神经网络处理所述目 标节点关联图, 得到目标落 地页特征, 包括: 利用所述图神经网络对邻域进行信 息融合, 并将经信 息融合后的邻域特征与 所述中心 节点的特 征进行拼接, 得到拼接后中心 节点特征; 利用所述图神经网络对所述拼接后中心节点特征进行非线性变换, 得到更新后中心节 点特征; 将落地页节点作为中心 节点的更新后中心 节点特征, 输出为所述目标落 地页特征。 6.一种落 地页搜索方法, 包括: 确定用于查询落 地页的实际查询词的语义特 征; 将拥有匹配于所述查询词语义特征的目标落地页特征的落地页, 作为搜索结果返回;权 利 要 求 书 1/3 页 2 CN 114926223 A 2其中, 所述目标落 地页特征根据权利要求1 ‑5任一项所述的落 地页特征生成方法得到 。 7.一种落 地页特征生成装置, 包括: 对应关系提取单元, 被配置成从用户的搜索会话中提取出会话内不同查询词之间的第 一对应关系, 以及查询词、 相关词、 落 地页三者中任意两者之间的第二对应关系; 原始节点关联图构建单元, 被配置成构建由所述查询词、 所述相关词、 所述落地页的语 义特征充当节点、 所述第一对应关系和所述第二对应关系充当节点之 间的边的原始节点关 联图; 目标节点关联图生成单元, 被配置成基于随机游走算法对所述原始节点关联图进行节 点邻域采样, 并通过对 采样结果进行迭代更新得到目标节点关联图; 目标落地页特征生成单元, 被配置成利用预设的图神经网络处理所述目标节点关联 图, 得到目标落 地页特征。 8.根据权利要求7 所述的装置, 其中, 所述对应关系提取 单元被进一 步配置成: 将用户的搜索会话中相邻 输入的两个不同查询词之间的关系, 确定为所述第 一对应关 系; 将用户的搜索会话中分别提取出查询词与相关词之间的关系、 查询词与落地页之间的 关系、 相关词与落 地页之间的关系, 得到所述第二对应关系。 9.根据权利要求7 所述的装置, 其中, 所述原 始节点关联图构建单 元被进一 步配置成: 以构建无向无权图的方式, 构建由所述查询词、 所述相关词、 所述落地页的语义特征充 当节点、 所述第一对应关系和所述第二对应关系充当节点之间的边的原 始无向无权图; 对应的, 所述目标节点关联图生成单 元被进一 步配置成: 基于随机游走算法对所述原始无向无权图进行节点邻域采样, 并通过对采样结果进行 迭代更新得到所述目标节点关联图。 10.根据权利要求7 所述的装置, 其中, 所述目标节点关联图生成单 元被进一 步配置成: 初始化所述原 始节点关联图中各节点间的相关性, 得到原 始相关性数值; 基于随机游走算法迭代更新所述原 始相关性数值, 得到更新后相关性数值; 将与所述更新后相关性数值对应的节点关联图, 确定为所述目标节点关联图。 11.根据权利要求7 ‑10任一项所述的装置, 其中, 所述目标落地页 特征生成单元被进一 步配置成: 利用所述图神经网络对邻域进行信 息融合, 并将经信 息融合后的邻域特征与 所述中心 节点的特 征进行拼接, 得到拼接后中心 节点特征; 利用所述图神经网络对所述拼接后中心节点特征进行非线性变换, 得到更新后中心节 点特征; 将落地页节点作为中心 节点的更新后中心 节点特征, 输出为所述目标落 地页特征。 12.一种落 地页搜索装置, 包括: 语义特征提取单元, 被配置成确定用于查询落 地页的实际查询词的语义特 征; 搜索结果返回单元, 被配置成将拥 有匹配于所述查询词语义特征的目标落地页 特征的 落地页, 作为搜索结果返回; 其中, 所述目标落地页特征根据权利要求7 ‑11任一项 所述的落 地页特征生成装置得到 。 13.一种电子设备, 包括:权 利 要 求 书 2/3 页 3 CN 114926223 A 3

.PDF文档 专利 落地页特征生成方法、落地页搜索方法及相关装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 落地页特征生成方法、落地页搜索方法及相关装置 第 1 页 专利 落地页特征生成方法、落地页搜索方法及相关装置 第 2 页 专利 落地页特征生成方法、落地页搜索方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。