说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210502150.7 (22)申请日 2022.05.09 (71)申请人 广州欢聚时代信息科技有限公司 地址 511442 广东省广州市番禺区南村镇 万博二路79 号万博商务区万达商业广 场北区B-1栋23层 (72)发明人 吴智东  (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06Q 30/06(2012.01) G06F 16/36(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 商品信息匹配方法及其装置、 设备、 介质、 产 品 (57)摘要 本申请涉及 商品信息匹配方法及其装置、 设 备、 介质、 产品, 所述方法包括: 获取待检测商品 实体的商品信息, 所述商品信息包含多个描述文 本, 提取其知识子图; 从知识图谱中检索出知识 子图与该待检测商品实体的知识子图相 匹配的 多个商品实体构成候选商品集; 获取候选商品集 中各个商品实体相对应的样本集; 将所述待检测 商品实体的商品信息逐一与所述候选商品集中 的商品实体的样本集进行语义匹配, 从中确定出 与待检测商品实体构成匹配的商品实体。 本申请 的技术方案适用于商品侵权检测场景, 在需要判 定待检测商品实体是否对某些商品实体构成侵 权时, 通过在查全的基础上进一步查准, 不仅可 以通过属性重合度所发挥的作用避免漏检, 而准 确识别出侵 权商品。 权利要求书3页 说明书19页 附图6页 CN 114782142 A 2022.07.22 CN 114782142 A 1.一种商品信息匹配方法, 其特 征在于, 包括如下步骤: 获取待检测商品实体的商品信息, 所述商品信 息包含多个描述文本, 提取其知识子图, 该知识子图包 含所述描述文本中抽取的属性与属性 值之间的映射关系数据; 从知识图谱中检索出知识子图与该待检测商品实体的知识子图相匹配的多个商品实 体构成候选商品集, 所述知识图谱存储有商品数据库中的多个商品实体相对应的所述知识 子图; 获取候选商 品集中各个商 品实体相对应的样本集, 所述样本集对应知识子图中的每个 属性包括有一个或多个描述文本, 所有样本集中各描述文本之间按照统一 顺序组织; 将所述待检测商品实体的商品信息逐一与所述候选商品集中的商品实体的样本集进 行语义匹配, 从中确定出与待检测商品实体构成匹配的商品实体。 2.根据权利要求1所述的商 品信息匹配方法, 其特征在于, 获取待检测商 品实体的商品 信息, 包括如下步骤: 响应线上店铺的商品发布请求, 获取该请求相对应的待检测商品实体的商品信息, 所 述商品信息包括该商品实体的商品标题、 商品详情、 商品属 性数据相对应的描述文本中任 意一项或多 项; 对待检测商 品实体的商 品信息进行属性抽取, 以根据不同属性从其各描述文本 中抽取 出相应的属性 值, 构成属性与属性 值之间的映射关系数据; 根据预设的知识图谱结构, 将待检测商 品实体的属性与属性值之间的映射关系数据构 造为相应的知识子图。 3.根据权利要求1所述的商 品信息匹配方法, 其特征在于, 获取待检测商 品实体的商品 信息的步骤之前, 包括如下步骤: 构造商品数据库相对应的知识图谱, 所述知识图谱包括与所述商 品数据库中的各个商 品实体相对应的知识子图, 所述知识子图包含从相应的商品实体的商品信息的描述文本中 抽取的属性与属性 值之间的映射关系数据。 4.根据权利要求3所述的商 品信息匹配方法, 其特征在于, 构造商 品数据库相对应的知 识图谱, 包括如下步骤: 创建知识图谱, 获取商品数据库中每 个商品实体的商品信息; 对所述每个商品实体的商 品信息进行属性抽取, 以根据不同属性从其各描述文本 中抽 取出相应的属性 值, 构成属性与属性 值之间的映射关系数据; 根据所述知识图谱的预设结构, 将每个商品实体的属性与属性值之间的映射关系数据 构造为相应的商品实体的知识子图; 获取每个商 品实体的商 品信息的不同描述版本, 每个描述版本中包含与该商品实体的 各个属性与属性值之间映射关系数据相匹配的描述文本, 按照统一顺序构 造出每个描述版 本相对应的样本, 将所有样本构成相应的商品实体的样本集, 存储于相 应的商品实体的知 识子图中。 5.根据权利要求1所述的商 品信息匹配方法, 其特征在于, 从知识图谱中检索出知识子 图与该待检测商品实体的知识子图相匹配的多个商品实体构成候选商品集, 包括如下步 骤: 获取待检测商品实体的知识子图中的属性与属性值之间的映射关系数据, 作为其属性权 利 要 求 书 1/3 页 2 CN 114782142 A 2集; 将待检测商品实体的属性集与知识图谱中各个商品实体相对应的属性集进行重合度 匹配计算, 确定知识图谱中每 个商品实体与待检测商品实体之间的属性重合度; 将知识图谱中属性重合度满足预设条件的商品实体集 合为候选商品集。 6.根据权利要求5所述的商 品信息匹配方法, 其特征在于, 将所述待检测商 品实体的商 品信息逐一与所述候选商品集中的商品实体的样本集进行语义匹配, 从中确定出与待检测 商品实体构成匹配的商品实体, 包括如下步骤: 计算待检测商品实体的商品信息与候选商品集中的商品实体的样本集之间的第一文 档相似度, 将商品实体相应的属性重合度作为该第一文档相似度的权重获得加权相似度, 筛选出加权相似度满足预设条件的商品实体构成第一商品集; 计算待检测商品实体的商品信息的语义向量与第一商品集中的商品实体的样本集的 语义向量之间的语义相似度, 筛选出语义相似度满足预设条件的商品实体构成第二商品 集; 将所述第二商品集中的商品实体, 作为与待检测商品实体构成匹配的商品实体, 推送 至提供所述待检测商品实体的商品信息的终端设备。 7.根据权利要求6所述的商 品信息匹配方法, 其特征在于, 计算待检测商 品实体的商品 信息的语义向量与第一商品集中的商品实体的样本集的语义向量之间的语义相似度的步 骤之前, 包括如下步骤: 采用知识图谱中的商品实体的样本集作为训练样本, 对预设的文本特征提取模型实施 迭代训练至收敛状态; 采用该文本特征提取模型分别提取所述第一商品集中各个商品实体的样本集以及待 检测商品实体的商品信息的语义向量。 8.一种商品信息匹配装置, 其特 征在于, 包括: 信息提取模块, 获取待检测商品实体的商品信 息, 所述商品信 息包含多个描述文本, 提 取其知识子图, 该知识子图包含所述描述文本中抽取的属性与属性值之间的映射关系数 据; 检索匹配模块, 从知识图谱中检索出知识子图与 该待检测商 品实体的知识子图相匹配 的多个商品实体构成候选商品集, 所述知识图谱存储有商品数据库中的多个商品实体相对 应的所述知识子图; 提取排序模块, 获取候选商品集中各个商品实体相对应的样本集, 所述样本集对应知 识子图中的每个属性包括有一个或多个描述文本, 所有样本集中各描述文本之 间按照统一 顺序组织; 语义匹配模块, 将所述待检测商 品实体的商 品信息逐一与所述候选商品集中的商品实 体的样本集进行语义匹配, 从中确定出与待检测商品实体构成匹配的商品实体。 9.一种计算机设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于调用 运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的 步骤。 10.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权 利要求1至7中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行权 利 要 求 书 2/3 页 3 CN 114782142 A 3

.PDF文档 专利 商品信息匹配方法及其装置、设备、介质、产品

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 商品信息匹配方法及其装置、设备、介质、产品 第 1 页 专利 商品信息匹配方法及其装置、设备、介质、产品 第 2 页 专利 商品信息匹配方法及其装置、设备、介质、产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:57:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。