说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210569401.3 (22)申请日 2022.05.24 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 胡玉婷 (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 苏培华 (51)Int.Cl. G06F 16/951(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06F 16/35(2019.01) (54)发明名称 一种名称匹配方法和装置 (57)摘要 本发明实施例提供了一种名称匹配方法和 装置, 涉及大数据领域, 所述方法包括: 响应于针 对待搜索的原始名称的搜索请求, 基于字符对所 述原始名称进行匹配; 若匹配失败, 则对所述原 始名称进行拆分, 得到多个分词, 并将所述多个 分词按照预设的类别进行分类, 得到多个具有类 别的分词; 基于所述类别中的目标类别对所述多 个分词进行重组, 得到多个候选名称; 将所述多 个候选名 称分别与预设的名 称数据库进行相似 度匹配, 确定出相似度最高的目标候选名称; 基 于训练完成的分类模型将所述目标候选名 称与 所述名称数据库进行语义分类匹配, 得到匹配结 果。 本发明实施例减少了匹配计算工作量, 提高 了匹配准确率。 权利要求书2页 说明书14页 附图2页 CN 114911999 A 2022.08.16 CN 114911999 A 1.一种名称匹配方法, 其特 征在于, 所述方法包括: 响应于针对待搜索的原 始名称的搜索请求, 基于 字符对所述原 始名称进行匹配; 若匹配失败, 则对所述原始名称进行拆分, 得到多个分词, 并将所述多个分词按照预设 的类别进行分类, 得到多个具有类别的分词; 基于所述类别中的目标类别对所述多个分词进行重组, 得到多个候选名称; 将所述多个候选名称分别与 预设的名称数据库进行相似度匹配, 确定出相似度最高的 目标候选名称; 基于训练完成的分类模型将所述目标候选名称与 所述名称数据库进行语义分类匹配, 得到匹配结果。 2.根据权利要求1所述的名称匹配方法, 其特征在于, 所述基于字符对所述原始名称进 行匹配, 包括: 检测所述名称数据库中是否存在与所述原 始名称的字符相同的名称; 若存在, 则匹配成功; 若不存在, 则匹配失败。 3.根据权利要求1所述的名称匹配方法, 其特征在于, 所述对所述原始名称进行拆分, 得到多个分词, 并将所述多个 分词按照预设的类型进 行分类, 得到多个具有类别的分词, 包 括: 采用jieba对所述原 始名称进行拆分, 得到多个分词; 将每个分词与预设的类别库进行匹配, 确定出每个分词一一对应的类别, 得到多个具 有类别的分词。 4.根据权利要求1所述的名称匹配方法, 其特征在于, 所述基于所述类别中的目标类别 对所述多个分词进行重组, 得到多个候选名称, 包括: 将所述多个分词中具有目标类别的分别与 具有非目标类别的分词分别进行重组, 得到 多个候选名称。 5.根据权利要求1所述的名称匹配方法, 其特征在于, 所述将所述多个候选名称分别与 预设的名称数据库进行相似度匹配, 确定出相似度最高的目标候选名称, 包括: 将所述多个候选名称分别与 所述名称数据库进行相似度匹配, 并确定出每个候选名称 的候选相似度; 确定出多个候选相似度中相似度最高的目标候选相似度, 并将所述目标候选相似度对 应的候选名称作为目标候选名称。 6.根据权利要求5所述的名称匹配方法, 其特征在于, 所述将所述多个候选名称分别与 所述名称数据库进行相似度匹配, 并确定出每 个候选名称的候选相似度, 包括: 针对所述多个候选名称中的任一候选名称, 将所述任一候选名称与 所述名称数据库中 的至少一个预设名称进行相似度匹配, 得到 至少一个相似度; 确定出所述至少一个相似度中相似度最高的候选相似度。 7.根据权利要求6所述的名称匹配方法, 其特征在于, 所述将所述任一候选名称与 所述 名称数据库中的至少一个预设名称进行相似度匹配, 得到 至少一个相似度, 包括: 针对所述至少一个预设名称中的任一预设名称, 获取所述任一候选名称与 所述任一预 设名称的前向最大公共子串和后向最大公共子串; 基于所述前向最大公共子串计算出前向相似度, 以及, 采用所述后向最大公共子串计权 利 要 求 书 1/2 页 2 CN 114911999 A 2算出后向相似度; 基于所述前向相似度和所述后向相似度, 计算出所述任一候选名称与 所述任一预设名 称的相似度。 8.根据权利要求5所述的名称匹配方法, 其特征在于, 所述确定出多个候选相似度中相 似度最高的目标候选相似度, 并将所述目标候选相似度对应的候选名称作为目标候选名 称, 包括: 基于前向最大公共子串和后向最大公共子串对所述多个候选相似度进行归一化处理, 得到相似度最高的目标候选相似度; 将所述目标候选相似度对应的候选名称作为目标候选名称。 9.根据权利要求1所述的名称匹配方法, 其特征在于, 所述基于训练完成的分类模型将 所述目标候选名称与所述名称数据库进行语义分类匹配, 得到匹配结果, 包括: 将所述目标候选名称输入训练完成的分类模型, 以使得所述分类模型采用预设的特征 指标将所述目标候选名称与所述名称数据库进行语义分类匹配; 若匹配成功, 则将匹配的预设名称作为匹配结果; 若匹配失败, 则生成匹配失败信息 。 10.一种名称匹配装置, 其特 征在于, 所述装置包括: 第一匹配模块, 用于响应于针对待搜索的原始名称的搜索请求, 基于字符对所述原始 名称进行匹配; 分词模块, 用于若匹配失败, 则对所述原始名称进行拆分, 得到多个分词, 并将所述多 个分词按照预设的类别进行分类, 得到多个具有类别的分词; 重组模块, 用于基于所述类别 中的目标类别对所述多个分词进行重组, 得到多个候选 名称; 第二匹配模块, 用于将所述多个候选名称分别与预设的名称数据库进行相似度匹配, 确定出相似度最高的目标候选名称; 分类模块, 用于基于训练完成的分类模型将所述目标候选名称与所述名称数据库进行 语义分类匹配, 得到匹配结果。 11.一种电子设备, 其特征在于, 包括: 处理器、 存储器及存储在所述存储器上并能够在 所述处理器上运行 的计算机程序, 所述计算机程序被所述处理器执行时实现如权利要求1 ~9中任一项所述名称匹配方法的步骤。 12.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储计算机程 序, 所述计算机程序被处理器执行时实现如权利要求 1~9中任一项 所述名称匹配方法的步 骤。权 利 要 求 书 2/2 页 3 CN 114911999 A 3
专利 一种名称匹配方法和装置
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 14:07:05
上传分享
举报
下载
原文档
(742.7 KB)
分享
友情链接
ISO-IEC-IEEE 29119-1 2022 Software and systems engineering - Software testing - Part 1 General concepts.pdf
ISO 22435 2024 Gas cylinders — Cylinder valves with integrated pressure regula.pdf
ISO 22662 2024 Milk and milk products — Determination of lactose content by.pdf
ISO 12224-1 2024 Solder wire solid and flux-cored Specification and test methods Part 1 Classification and performance requirements.pdf
ISO 21308-1 2018 Road vehicles Product data exchange between chassis and bodywork manufacturers (BEP) Part 1 General principles.pdf
ISO 603-9 2024 Bonded abrasive products — Dimensions — Part 9 Grinding wheels.pdf
ISO 7076-6 2016 Fire protection — Foam fire extinguishing systems — Part 6 Vehicle mounted compressed air foam systems.pdf
ISO IEC 26550 2015 Software and systems engineering — Reference model for product line engineering and management.pdf
ISO 13879 1999 Petroleum and natural gas industries — Content and drafting of a functional specification.pdf
ISO 13799 2020 Ships and marine technology Ship s mooring and towing fittings Recessed bitts (casting type).pdf
GB-T 20658-2006 原油和液体石油产品 粘稠烃的体积计量.pdf
GB-T 24136-2009 橡胶或塑料涂覆织物 耐液体性能的测定.pdf
GB-T 4167-2024 砝码.pdf
GB-T 41146-2021 绝缘液体取样方法.pdf
GB-T 21355-2022 无损检测 基于存储磷光成像板的工业计算机射线照相检测 系统分类.pdf
GB-T 17127.2-1997 农业轮式拖拉机和机具 三点悬挂挂接器 第2部分 A型框架式挂接器.pdf
GB-T 44452-2024 工业过程测量控制和自动化 系统和部件的生命周期管理.pdf
GB-T 12204-2010 金属切削 基本术语.pdf
GB-T 23129-2008 家用咖啡机性能测试方法.pdf
GB 9448-1999 焊接与切割安全.pdf
1
/
3
19
评价文档
赞助1.5元 点击下载(742.7 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。