专利一种面向权利要求点的检索方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221070286 5.7 (22)申请日 2022.06.21 (71)申请人之江实验室地址 311100 浙江省杭州市余杭区中泰街道之江实验室南湖总部 (72)发明人朱亚光　徐小良　 (74)专利代理机构杭州浙科专利事务所(普通合伙) 33213 专利代理师陈洁 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06Q 50/18(2012.01) (54)发明名称一种面向权利要求点的检索方法和装置 (57)摘要本发明属于人工智能领域，公开了一种面向权利要求点的检索方法和装置，包括如下步骤：步骤1：专利权利要求点语义化模型生成：流水线生成模型包括专利数据采集、数据预处理、迭代训练、模型生成、模型部署；步骤2：专利权利要求点检索方法；该检索方法包括了前期专利数据生成向量，向量插入向量数据库，构建索引和检索；步骤3：利用专利权利要求点的检索系统，调用后端检索接口得到Top K检索结果，显示到界面上。本发明针对权利要求点的向量检索，大大缩短了专利检索时间，能够以较短的时间提供给用户高质量的专利检索结果。权利要求书2页说明书4页附图1页 CN 115238083 A 2022.10.25 CN 115238083 A 1.一种面向权利要求点的检索方法，其特征在于，包括如下步骤：步骤1：专利权利要求点语义化模型生成：该模型生成包括专利数据采集、数据预处理、迭代训练、模型生成、模型部署；步骤2：专利权利要求点检索；该检索方法包括了前期专利数据生成向量，向量插入向量数据库，构建索引和检索；步骤3：利用专利权利要求点的检索系统，调用后端检索接口得到Top K检索结果，显示到界面上。 2.根据权利要求1所述的面向权利要求点的检索方法，其特征在于，所述步骤1的专利权利要求点语义化模型生成方法包括采集原始专利数据，采集完成后并不断同步至源数据库，通过预处理提取专利权利要求点之后，进入设计好的模型生成流水线；进行第一轮训练，生成了初始版本的语义化模型，随后随着专利数据的更新，流水线会根据专利数据的增加自动执行训练任务，进行模型更新。 3.根据权利要求1所述的专利权利要求点检索方法，其特征在于，所述步骤2 的专利权利要求点的检索，是将原始的专利权利要求点数据通过步骤1的语义模型生成向量数据，然后把向量数据插入向量数据库，接着对向量数据构建索引，然后将待检索技术特征描述数据也生成向量，最后根据该向量进行检索，得到检索结果。 4.根据权利要求1所述的专利权利要求点检索方法，其特征在于，步骤3所述专利权利要求点的检索系统，调用后端检索接口得到Top K检索结果，显示到界面上。 5.根据权利要求1所述的面向权利要求点的检索方法，其特征在于，所述步骤1包括如下具体步骤：步骤1.1：专利数据采集并存储，采集的数据包括专利的正文信息和权利要求书信息；步骤1.2：数据的预处理，提取权利要求点信息，并导出；步骤1.3：原始专利数据经过等量切割成多个数据块，对这些数据块按顺序逐一训练；步骤1.4：把第一个数据块作为初始数据，训练参数为初始默认值，开始第一轮训练，得到第一轮训练的语义化模型和参数；步骤1.5：根据第一轮训练的模型和参数，和第二个数据块，进行第二轮训练，得到第二轮训练的模型和参数；按照此步骤迭代训练，直到将存量训练数据训练完得到最终的训练模型和参数；步骤1.6：随着原始专利数据继续增加，达到可以训练的阈值数据量后，便导出数据，在上一个步骤基础上继续训练，得到最新的训练模型和参数；步骤1.7：最新的模型一旦生成，便直接通过 kubeflow KFServing部署到后端服务中去；步骤1.8：将以上步骤编写成流水线模版，把训练环境打包成Docker镜像，实现全流程流水线化和自动化。 6.根据权利要求1所述的面向权利要求点的检索方法，其特征在于，所述步骤2包括如下具体步骤：步骤2.1：原始的专利权利要求点数据，经过步骤1生成的语义化模型生成向量，然后把转换的向量逐一插入到向量数据库中；步骤2.2：配置构建索引参数，对向量数据库中的权利要求点数据构建索引；权　利　要　求　书 1/2 页 2 CN 115238083 A 2步骤2.3：构建完索引，进行基于权利要求点的专利检索，将待检索的技术特征描述数据，经过步骤1生成的语义模型生成向量，根据生成向量调用向量数据库的检索接口进行向量检索，得到Top K检索结果；步骤2.4：随着采集的专利数据继续增加，达到可以训练的阈值数据量后，便导出数据；对于增量数据，经过步骤1生成的语义化模型转化成向量，然后把转换的向量逐一插入到向量数据库mi lvus 中；最后对于增量向量数据构建索引。 7.根据权利要求1所述的面向权利要求点的检索方法和装置，其特征在于，所述步骤3 包括如下具体步骤：步骤3.1：用户在前端输入待检索的技术特征描述数据；步骤3.2：前端输入待检索的技术特征描述数据，经过语义化模型生成向量；步骤3.3：基于生成后的向量，使用向量数据库的接口进行向量检索，得到Top K检索结果，并显示在前端。 8.一种面向权利要求点的检索装置，包括控制器，其特征在于，所述控制器包括存储器、处理器及存储在存储器上的可在处理器上运行的计算机程序，处理器执行程序时实现如权利要求1 ‑7任一项所述方法的步骤。权　利　要　求　书 2/2 页 3 CN 115238083 A 3

专利 一种面向权利要求点的检索方法和装置

专利一种面向权利要求点的检索方法和装置