说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210797214.0 (22)申请日 2022.07.08 (71)申请人 北京星河信舟 科技有限公司 地址 100096 北京市海淀区西三 旗建材城 内4幢一层1 17号 (72)发明人 康凯森  (74)专利代理 机构 北京华夏泰和知识产权代理 有限公司 1 1662 专利代理师 张娜 刘立志 (51)Int.Cl. G06F 16/27(2019.01) G06F 16/36(2019.01) G06F 16/2458(2019.01) (54)发明名称 全局字典的构建方法、 装置、 电子设备及存 储介质 (57)摘要 本发明实施例涉及一种全局字典的构建方 法、 装置、 电子设备及存储介质, 所述方法包括: 在接收到针对分布式数据库中的字符串的查询 请求的情况下, 从分布式数据库对应的局部字典 集合中, 确定包括目标字段的局部字典子集; 其 中, 局部字典包括字符串集合; 目标字段为查询 请求的查询对象所属的字段。 基于局部字典子集 中的局部字典包括的字 符串集合, 构建分布式数 据库的全局字典。 以此相较于现有技术中, 在数 据导入时, 就构建全局字典, 节省了数据库的存 储空间和计算资源, 进而利用全局字典提高了查 询效率。 权利要求书2页 说明书15页 附图7页 CN 114880403 A 2022.08.09 CN 114880403 A 1.一种全局字典的构建方法, 其特 征在于, 所述方法包括: 在接收到针对分布式数据库中的字符串的查询 请求的情况下, 从所述分布式数据库对 应的局部字典集合中, 确定包括目标字段的局部字典子集; 其中, 局部字典包括字符串集 合; 所述目标字段为所述 查询请求的查询对象所属的字段; 基于所述局部字典子集中的局部字典包括的字符串集合, 构建所述分布式数据库的全 局字典。 2.根据权利要求1所述的方法, 其特征在于, 所述在接收到针对分布式数据库中的字符 串的查询请求的情况下, 从所述分布式数据库对应的局部字典集合中, 确定包括 目标字段 的局部字典子集, 包括: 在接收到针对分布式数据库中的字符串的查询 请求的情况下, 确定所述查询请求的查 询对象包括的字符串的数量, 得到第一数量; 在所述第一数量小于或等于第 一数量阈值的情况下, 从所述分布式数据库对应的局部 字典集合中, 确定包括目标字段的局部 字典子集。 3.根据权利要求1所述的方法, 其特征在于, 所述分布式数据库包括多个网络节点, 所 述多个网络节点中的每 个网络节点对应多个局部 字典; 以及 所述基于所述局部字典子集中的局部字典包括的字符串集合, 构建所述分布式数据库 的全局字典, 包括: 针对所述多个网络节点中的每个网络节点, 确定该网络节点对应的各个局部字典分别 包括的每个字符串集合的基数, 得到该字符串集合对应的第一基数; 在该字符串集合对应 的第一基数小于或等于第二数量阈值的情况 下, 将该字符串集 合确定为目标字符串集 合; 基于所确定的各个目标字符串集 合, 构建所述分布式数据库的全局字典。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所确定的各个目标字符串集合, 构建所述分布式数据库的全局字典, 包括: 针对所述多个网络节点中的每个网络节点, 确定该网络节点对应的各个目标字符串集 合的并集, 得到该网络节点对应的第一并集; 将该网络节点对应的第一并集的基数, 确定为 该网络节点对应的第二基数; 在该网络节点对应的第二基数小于或等于所述第二数量阈值 的情况下, 将该网络节点对应的第一并集确定为目标第一并集; 基于所确定的各个目标第一并集, 构建所述分布式数据库的全局字典。 5.根据权利要求4所述的方法其特征在于, 所述基于所确定的各个目标第 一并集, 构建 所述分布式数据库的全局字典, 包括: 将所确定的各个目标第一并集的并集, 确定为第二并集; 将所述第二并集的基数, 确定为第三基数; 在所述第三基数小于或等于所述第二数量阈值的情况下, 基于所述第二并集, 构建所 述分布式数据库的全局字典。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述第二并集, 构建所述分布式 数据库的全局字典, 包括: 确定所述第二并集中的每 个字符串的整型 标识; 基于所述第二并集中的各个字符串, 以及所述各个字符串的各个整型标识, 构建全局 字典。权 利 要 求 书 1/2 页 2 CN 114880403 A 27.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 确定所述全局字典, 是否包 含所述第二并集中的全部 字符串; 在所述全局字典中包 含所述全部 字符串的情况 下, 确定所述全局字典有效; 在所述全局字典中并非包 含所述全部 字符串的情况 下, 确定所述全局字典无效。 8.根据权利要求7 所述的方法, 其特 征在于, 所述确定所述全局字典有效之后, 还 包括: 确定表征所述全局字典生成顺序的版本号, 并对所述全局字典根据预设格式进行存 储。 9.根据权利要求1 ‑8之一所述的方法, 其特征在于, 所述确定所述全局字典有效之后, 还包括: 确定所述全局字典中的字符串的数量, 得到第二数量; 如果所述第二数量大于第三数量阈值, 则确定所述全局字典中无 所述查询对象。 10.一种全局字典的构建装置, 其特 征在于, 所述装置包括: 局部字典确定模块, 用于在接收到针对分布式数据库中的字符串的查询请求的情况 下, 从所述分布式数据库对应的局部字典集合中, 确定包括目标字段的局部字典子集; 其 中, 局部字典包括字符串集 合; 所述目标字段为所述 查询请求的查询对象所属的字段; 全局字典确定模块, 用于基于所述局部字典子集中的局部字典包括的字符串集合, 构 建所述分布式数据库的全局字典。 11.一种电子设备, 其特征在于, 包括: 处理器和存储器, 所述处理器用于执行所述存储 器中存储的全局字典的构建程序, 以实现权利要求1~9中任一项所述的全局字典的构建方 法。 12.一种存储介质, 其特征在于, 所述存储介质存储有一个或者多个程序, 所述一个或 者多个程序可被一个或者多个处理器执行, 以实现权利要求1~9中任一项所述的全局字典 的构建方法。权 利 要 求 书 2/2 页 3 CN 114880403 A 3

.PDF文档 专利 全局字典的构建方法、装置、电子设备及存储介质

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 全局字典的构建方法、装置、电子设备及存储介质 第 1 页 专利 全局字典的构建方法、装置、电子设备及存储介质 第 2 页 专利 全局字典的构建方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:57:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。