说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221070286 5.7 (22)申请日 2022.06.21 (71)申请人 之江实验室 地址 311100 浙江省杭州市余杭区中泰街 道之江实验室南湖总部 (72)发明人 朱亚光 徐小良  (74)专利代理 机构 杭州浙科专利事务所(普通 合伙) 33213 专利代理师 陈洁 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06Q 50/18(2012.01) (54)发明名称 一种面向权利要求 点的检索方法和装置 (57)摘要 本发明属于人工智能领域, 公开了一种面向 权利要求点的检索方法和装置, 包括如下步骤: 步骤1: 专利权利要求点语义化模型生成: 流水线 生成模型包括专利数据采集、 数据预处理、 迭代 训练、 模型生成、 模型部署; 步骤2: 专利权利要 求 点检索方法; 该检索方法包括了前期专利数据生 成向量, 向量插入向量数据库, 构建索引和检索; 步骤3: 利用专利权利要求点的检索系统, 调用后 端检索接口得到Top  K检索结果, 显示到界面上。 本发明针对权利要求点的向量检索, 大大缩短了 专利检索时间, 能够以较短的时间提供给用户高 质量的专利检索结果。 权利要求书2页 说明书4页 附图1页 CN 115238083 A 2022.10.25 CN 115238083 A 1.一种面向权利要求 点的检索方法, 其特 征在于, 包括如下步骤: 步骤1: 专利权利要求点语义化模型生成: 该模型生成包括专利数据采集、 数据 预处理、 迭代训练、 模型生成、 模型部署; 步骤2: 专利权利要求点检索; 该检索方法包括了前期专利数据生成向量, 向量插入向 量数据库, 构建索引和检索; 步骤3: 利用专利权利 要求点的检索系统, 调用后端检索接口得到Top  K检索结果, 显示 到界面上。 2.根据权利要求1所述的面向权利要求点的检索方法, 其特征在于, 所述步骤1的专利 权利要求点语义化模型生成方法包括采集原始专利数据, 采集完成后并不断同步至源数据 库, 通过预处理提取专利权利要求点之后, 进入设计好的模型生成流水线; 进行第一轮训 练, 生成了初始版本的语义化模型, 随后随着专利数据的更新, 流水线会根据专利数据的增 加自动执 行训练任务, 进行模型 更新。 3.根据权利要求1所述的专利权利要求点检索方法, 其特征在于, 所述步骤2 的专利权 利要求点的检索, 是将原始的专利权利要求点数据通过步骤1的语义模型生 成向量数据, 然 后把向量数据插入向量数据库, 接着对向量数据构建索引, 然后将待检索技术特征描述数 据也生成向量, 最后根据该向量进行检索, 得到检索结果。 4.根据权利要求1所述的专利权利要求点检索方法, 其特征在于, 步骤3所述专利权利 要求点的检索系统, 调用后端检索接口得到Top  K检索结果, 显示到界面上。 5.根据权利要求1所述的面向权利要求点的检索方法, 其特征在于, 所述步骤1包括如 下具体步骤: 步骤1.1: 专利数据采集并存 储, 采集的数据包括专利的正文信息和权利要求书信息; 步骤1.2: 数据的预处 理, 提取权利要求 点信息, 并导出; 步骤1.3: 原 始专利数据经 过等量切割成多个数据块, 对这些 数据块按顺序逐一训练; 步骤1.4: 把第一个数据块作 为初始数据, 训练参数为初始默认值, 开始第一轮训练, 得 到第一轮训练的语义 化模型和参数; 步骤1.5: 根据第一轮训练的模型和参数, 和第二个数据块, 进行第二轮训练, 得到第二 轮训练的模型和参数; 按照此步骤迭代训练, 直到将存量训练数据训练完得到最终的训练 模型和参数; 步骤1.6: 随着原始专利数据继续增加, 达到可以训练的阈值数据量后, 便导出数据, 在 上一个步骤基础上继续训练, 得到最 新的训练模型和参数; 步骤1.7: 最新 的模型一旦生成, 便直接通过  kubeflow  KFServing部署到后端服务中 去; 步骤1.8: 将以上步骤编写成流水线模版, 把训练环境打包成Docker镜像, 实现全流程 流水线化和自动化。 6.根据权利要求1所述的面向权利要求点的检索方法, 其特征在于, 所述步骤2包括如 下具体步骤: 步骤2.1: 原始的专利权利要求点数据, 经过步骤1生成的语义化模型生成向量, 然后把 转换的向量逐一插 入到向量数据库中; 步骤2.2: 配置构建索引参数, 对向量数据库中的权利要求 点数据构建索引;权 利 要 求 书 1/2 页 2 CN 115238083 A 2步骤2.3: 构建完索引, 进行基于权利要求点的专利检索, 将待检索的技术特征描述数 据, 经过步骤1生成的语义模型生 成向量, 根据生成向量调用向量数据库的检索接口进行向 量检索, 得到Top  K检索结果; 步骤2.4: 随着采集的专利数据继续增加, 达到可以训练的阈值数据量后, 便导出数据; 对于增量数据, 经过步骤1生成的语义化模型转化成向量, 然后把转换的向量逐一插入到向 量数据库mi lvus 中; 最后对于增量向量数据构建索引。 7.根据权利要求1所述的面向权利要求点的检索方法和装置, 其特征在于, 所述步骤3 包括如下 具体步骤: 步骤3.1: 用户在前端输入待检索的技 术特征描述数据; 步骤3.2: 前端输入待检索的技 术特征描述数据, 经 过语义化模型生成向量; 步骤3.3: 基于生成后的向量, 使用向量数据库的接口进行向量检索, 得到Top  K检索结 果, 并显示在前端。 8.一种面向权利要求点的检索装置, 包括控制器, 其特征在于, 所述控制器包括存储 器、 处理器及存储在存储器上 的可在处理器上运行 的计算机程序, 处理器执行程序时实现 如权利要求1 ‑7任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115238083 A 3

.PDF文档 专利 一种面向权利要求点的检索方法和装置

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向权利要求点的检索方法和装置 第 1 页 专利 一种面向权利要求点的检索方法和装置 第 2 页 专利 一种面向权利要求点的检索方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。