说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210888848.7 (22)申请日 2022.07.27 (71)申请人 浪潮软件科技有限公司 地址 250100 山东省济南市高新区浪潮路 1036号浪潮科技园 (72)发明人 朱波 程林  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 姜丽洁 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/31(2019.01) G06F 16/35(2019.01) G06F 16/338(2019.01) G06F 16/951(2019.01)G06F 40/289(2020.01) G06Q 40/00(2012.01) (54)发明名称 一种知识库平台维护方法及装置 (57)摘要 本发明涉及引擎技术领域, 具体提供了一种 知识库平台维护方法, 具有如下步骤: S1、 将涉税 数据信息存入知识平台文本数据库中; S2、 利用 PageRank改进技术将采集的税务数据信息进行 初始化; S3、 对采集的网页信息排名值进行判定; S4、 设计数据表; S5、 知 识库维护形 成时会按照业 务类型进行知识的分类。 与现有技术相比, 本发 明能够使的税务人员等用户不断扩展相关查询 内容, 增强可读性, 极大程度上促进税务工作开 展, 增强税务人员的满意度。 权利要求书2页 说明书5页 附图2页 CN 115292514 A 2022.11.04 CN 115292514 A 1.一种知识库平台维护方法, 其特 征在于, 具有如下步骤: S1、 将涉税数据信息存 入知识平台文本数据库中; S2、 利用Pa geRank改进技术将采集的税务数据信息进行初始化; S3、 对采集的网页信息排名值进行判定; S4、 设计数据表; S5、 知识库维护形成时会按照业 务类型进行知识的分类。 2.根据权利要求1所述的一种知识库平台维护方法, 其特征在于, 在步骤S1中, 首先利 用网络爬虫将互联网和第三方涉税数据信息存入到知识平台的文本数据库中, 同时也可以 提取网页的一些链接信息, 并对 税务信息进行分词、 预处 理、 存储和建立索引。 3.根据权利要求1或2所述的一种知识库平台维护方法, 其特征在于, 在步骤S2中, 利用 PageRank改进技术将采集的税务数据信息进行初始化, 主要进行PR值的初始化, 所述PR值 为网页的排名信息值。 4.根据权利要求3所述的一种知识库平台维护方法, 其特征在于, 在步骤S3中, 对采集 的网页信息排名值进 行判定, 如果PR值一直处于稳定不 发生变化, 则跳出迭代计算流程, 直 接将排名结果存 储到数据库中、 待用户查询时直接反馈给用户; 如果PR值一直处于变化状态, 则需要对PR值进行重新计算, 计算时需要建立相关的数 据模型, 根据PageR ank改进技术, 循环迭代的计算链接页面 或者信息数据的主题相关度, 最 终形成重新计算完成后的PR排名值, 当用户进行知识检索时, 就会根据排名值对信息进行 展示, 供用户分析使用。 5.根据权利要求4所述的一种知识库平台维护方法, 其特征在于, 在步骤S4中, 知识库 维护过程中对网页或者信息的PR值、 来源和时间数据项 进行存储, 设计数据表。 6.根据权利要求4所述的一种知识库平台维护方法, 其特征在于, 在步骤S5中, 知识库 维护形成时会按照业务类型进 行知识的分类, 主要包括各税管理、 基础性征收管理、 税务稽 查、 督察内审和法律救济 。 7.一种知识库平台维护系统, 其特征在于, 首先, 将涉税数据信 息存入知识平台文本数 据库中, 利用PageR ank改进技术将采集的税务数据信息进行初始 化, 然后, 对采集的网页信 息排名值进行判定, 设计数据表; 最后, 知识库维护形成时会按照业务类型进行知识的分 类。 8.根据权利要求7所述的一种知识库平台维护系统, 其特征在于, 首先利用网络爬虫将 互联网和 第三方涉税数据信息存入到知识平台的文本数据库中, 同时也可以提取网页的一 些链接信息, 并对 税务信息进行分词、 预处 理、 存储和建立索引; 利用PageRank改进技术将采集的税务数据信息进行初始化, 主要进行PR值的初始化, 所述PR值 为网页的排名信息值。 9.根据权利要求8所述的一种知识库平台维护系统, 其特征在于, 对采集的网页信 息排 名值进行判定, 如果PR值一直处于稳定不 发生变化, 则跳出迭代计算流程, 直接将排名结果 存储到数据库中、 待用户查询时直接反馈给用户; 如果PR值一直处于变化状态, 则需要对PR值进行重新计算, 计算时需要建立相关的数 据模型, 根据PageR ank改进技术, 循环迭代的计算链接页面 或者信息数据的主题相关度, 最 终形成重新计算完成后的PR排名值, 当用户进行知识检索时, 就会根据排名值对信息进行权 利 要 求 书 1/2 页 2 CN 115292514 A 2展示, 供用户分析使用。 10.根据权利要求9所述的一种知识库平台维护系统, 其特征在于, 知识库维护过程中 对网页或者信息的PR值、 来源和时间数据项 进行存储, 设计数据表; 知识库维护形成时会按照业务类型进行知识 的分类, 主要包括各税管理、 基础性征收 管理、 税务稽查、 督 察内审和法律救济 。权 利 要 求 书 2/2 页 3 CN 115292514 A 3

.PDF文档 专利 一种知识库平台维护方法及装置

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种知识库平台维护方法及装置 第 1 页 专利 一种知识库平台维护方法及装置 第 2 页 专利 一种知识库平台维护方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:55:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。