说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210702228.X (22)申请日 2022.06.21 (65)同一申请的已公布的文献号 申请公布号 CN 114791941 A (43)申请公布日 2022.07.26 (73)专利权人 北京有生博大 软件股份有限公司 地址 100142 北京市海淀区阜成路58号 4层 412 (72)发明人 王洪哲 叶海峰 蔡静静 李静波  乌力吉德力格尔  武栋梁 毕智超  曲金凤  (74)专利代理 机构 北京智丞瀚方知识产权代理 有限公司 1 1810 专利代理师 杨乐(51)Int.Cl. G06F 16/31(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01) 审查员 黄子怡 (54)发明名称 一种静默化数据处 理方法及处 理系统 (57)摘要 本发明实施例公开了一种静默化数据处理 方法及处理系统包括步骤S1、 识别静默化数据; 步骤S2、 对静默化数据进行分词处理, 得到索引 信息, 建立索引信息与信息坐标之间的信息对; 步骤S3、 将信息对转换为倒排索引, 得到倒排索 引信息; 步骤S4、 根据倒排索引信息中的索引信 息构建前缀树, 最后将前缀树存入索引数据库 内。 本发明实施例所述的静默化数据处理方法及 处理系统增加了用于储存冷数据、 长期固化数据 的数据结转库, 设置静默化规则, 以识别冷数据, 将满足静默化规则的数据存入数据结转库中, 从 而分担业务数据库的压力, 实现数据分流, 提高 查询业务数据的效率, 实现业务数据库的轻量运 行, 高效处 理增删改查 等各类用户操作。 权利要求书2页 说明书6页 附图5页 CN 114791941 B 2022.08.26 CN 114791941 B 1.一种静默化数据处 理方法, 其特 征在于, 包括以下步骤: 步骤S1、 识别数据库中处于静默化状态的数据, 得到静默化数据, 并将静默化数据从数 据库转移到历史结转库; 步骤S2、 对静默化数据进行分词处理, 得到索引信 息, 建立索引 信息与静默化数据 所在 信息的信息坐标之间的信息对; 步骤S3、 将所述信息对转换为倒排索引, 得到倒排索引信息; 步骤S4、 根据倒排索引信息中的索引信息构建前缀树, 所述倒排索引信息的信息坐标 设在所述索引信息位于前缀树中两位最小 单位信息之 间的键中, 若在前缀树的相同层级中 出现至少 两个相同的索引信息, 则将至少 两个相同的索引信息的节点合并为共用节点, 最 后将前缀 树存入索引数据库内。 2.根据权利要求1所述的一种静默化数据处理方法, 其特征在于: 所述静默化数据的识 别方法包括时间筛 选与条件筛 选; 所述时间筛选内设有筛选时间, 设置筛选时间后, 数据的存储时间位于筛选时间之前 的数据均为静默化数据; 所述条件筛选内设有筛选条件, 设置筛选条件后, 若已储存的数据满足筛选条件, 则该 数据为静默化数据。 3.根据权利要求1所述的一种静默化数据处理方法, 其特征在于, 所述信 息对的建立方 法包括: 为经过分词处理后的索引信 息添加其对应的静默化数据的信 息坐标, 得到单坐标信 息 对; 将具有相同索引信息的单坐标信息对合并, 合并方法为索引信息不变, 多个单坐标信 息对的信息坐标合并, 得到一个具有单索引信息多信息坐标的信息对。 4.根据权利要求1所述的一种静默化数据处理方法, 其特征在于, 所述倒 排索引的转换 方法为将信息对中的信息坐标与索引信息转换位置 。 5.根据权利要求1所述的一种静默化数据处理方法, 其特征在于: 所述前缀树的构建方 法为将倒排索引信息中的索引信息拆分为有序排列的最小 单位信息, 然后根据最小单位信 息的排列顺序依次设置在前缀树中的不同层级的节点中, 所述前缀树的第一层级节点设为 前缀树的属 性节点, 所述前缀树的第二层级节点设为首位最小单位信息的节点, 最小单位 信息的排序每靠后一位, 则其在前缀树中的节点至少向下移动一个层级, 若不同索引信息 中出现相同层级且相同最小单位信息时, 则将两个最小单位信息的节点进行合并, 得到共 用节点, 指向共用节点的两个前节点均 与共用节点之间建立键 。 6.根据权利要求1所述的一种静默化数据处理方法, 其特征在于: 所述倒 排索引信息的 信息坐标设置在前缀树中所述倒排索引信息中索引信息的最后两位最小单位信息之间的 键中。 7.根据权利要求1所述的一种静默化数据处理方法, 其特征在于: 所述信 息坐标添加区 分标签。 8.一种使用权利要求1 ‑7中任意一项所述静默化数据处理方法的静默化数据处理系 统, 其特征在于, 包括: 数据库、 索引数据库、 数据处理模块及历史结转库, 所述数据处理模 块用于识别数据库中处于静默化状态的数据, 得到静默化数据, 并将静默化数据从数据库权 利 要 求 书 1/2 页 2 CN 114791941 B 2转移到历史结转库, 对静默化数据进 行分词处理, 得到索引信息, 建立索引信息与静默化数 据所在信息的信息坐标之 间的信息对, 将所述信息对转换为倒排索引, 得到倒排索引信息, 根据倒排索引信息中的索引信息构建前缀树, 所述倒排索引信息的信息坐标设在索引信息 位于前缀树中最后两位最小单位信息之 间的键中, 若在前缀树的相同层级中出现相同的两 个索引信息, 则将两个索引信息的节点 合并为共用节点, 最后将前缀 树存入索引数据库内。 9.根据权利要求8所述的静默化数据处理系统, 其特征在于: 所述数据处理模块包括数 据识别子模块、 分词子模块、 倒排索引子模块及前缀 树子模块; 所述数据识别子模块用于识别数据库中的静默化数据; 所述分词子模块用于对静默化数据进行分词处理, 得到索引信息, 并建立索引信息与 其对应静默化数据的信息坐标之间的信息对; 所述倒排索引子模块用于对信息对转换倒排索引, 得到倒排索引信息; 所述前缀树子模块用于根据倒 排索引信息中的索引 信息建立前缀树, 并将倒排索引 信 息中的信息坐标设在索引信息位于前缀树中最后两位最小 单位信息之 间的键中, 若在前缀 树的相同层级中出现相同的两个索引信息, 则将两个索引信息的节点合并为共用节点, 最 后将前缀 树存入索引数据库内。权 利 要 求 书 2/2 页 3 CN 114791941 B 3

.PDF文档 专利 一种静默化数据处理方法及处理系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种静默化数据处理方法及处理系统 第 1 页 专利 一种静默化数据处理方法及处理系统 第 2 页 专利 一种静默化数据处理方法及处理系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。