说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210942370.1 (22)申请日 2022.08.08 (71)申请人 国网浙江省电力有限公司信息通信 分公司 地址 310016 浙江省杭州市 市民街219号 申请人 东南大学 (72)发明人 毛冬 王红凯 姚一杨 陈彤  徐海洋 黄杰 黄奇 肖志清  (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 叶倩 (51)Int.Cl. H04L 67/1008(2022.01) H04L 67/101(2022.01) H04L 67/1029(2022.01)H04L 67/1097(2022.01) G06F 16/2458(2019.01) G06F 9/50(2006.01) (54)发明名称 面向分布式存 储系统的查询负载均衡方法 (57)摘要 本发明公开了一种面向分布式存储系统的 查询负载均衡方法, 基于跟随者数据查询机制, 设计基于代 价评估的数据查询路由策略, 通过分 析查询过程消耗的资源情况, 动态进行查询节点 选择, 完成数据查询; 其中, 跟随者数据查询机制 为: 对集中于领导者的查询请求向跟随者节点进 行负载转移, 执行数据查询; 基于代价评估的数 据查询路由策略为: 收集当前存储的各存储节点 的通信开销进行动态的代价评估, 选择最合适的 跟随者节 点执行跟随者数据查询, 均衡利用节点 的计算资源。 权利要求书2页 说明书6页 附图3页 CN 115378947 A 2022.11.22 CN 115378947 A 1.面向分布式存储系统的查询负载均衡方法, 其特征在于: 基于跟随者数据查询机制, 设计基于代价评估的数据查询路由策略, 通过分析查询过程消 耗的资源情况, 动态进行查 询节点选择, 完成数据查询; 所述跟随者数据查询机制为: 对集中于领导者的查询请求向跟随者节点进行负载转 移, 执行数据查询; 所述基于代价评估的数据查询路由策略为: 收集当前存储的各存储节点的通信开销进 行动态的代价评估, 选择最 合适的跟随者节点执 行跟随者数据查询。 2.如权利要求1所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 所述跟 随者数据查询机制具体包括如下步骤: S1: 跟随者节点接受客户端数据查询请求; S2: 跟随者节点向领导者节点发起日志信息校验请求, 所述请求是应对集群中各节点 状态在不断切换时, 跟随者节点依旧保持与领导 者数据的一 致性; S3: 领导者节点向其他跟随者节点确认自身领导者地位, 获得认证后向跟随者响应日 志信息, 所述领导者通过主动向跟随者节点广播心跳信息, 来确认自身 领导者角色, 向请求 日志信息校验的跟随者节点反馈当前集群的Com mitIndex; S4: 跟随者节点接收反馈信息, 在确认自身具备最新数据后执行查询操作并响应客户 端, 所述反馈信息仅包 含日志信息 CommitIndex。 3.如权利要求2所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 所述跟 随者数据查询机制的步骤S4中, 跟随者节点接收反馈信息后, 与自身存储数据的日志信息 进行比较, 若本地CommitIn dex大于等于领导者节点的CommitIndex, 即可确认自身节点已 具备最新数据, 执 行查询操作, 读取目标 数据并响应客户端。 4.如权利要求2所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 所述基 于代价评估的数据查询路由策略具体包括如下步骤: S1'、 统计数据查询代价信息: 通过计算数据存储范围分区中的每个键值对的数据大 小, 来进行 数据查询代价信息统计; S2'、 确定参数: 根据步骤S1'统计获得的数据 查询代价信息, 确定影响代价评估的常量 因子, 计算路由选择算法参数; 所述影响代价评估的常量因子为计算机硬件信息; S3'、 计算查询操作代价: 依据基于代价评估的数据查询路由策略, 计算各个节点的查 询操作代价, 所述 查询操作代价 为节点与存 储层之间数据处 理过程的耗时; S4'、 确定目的节点: 根据步骤S3'的操作代价值, 确定查询路由, 根据对各节点的代价 评估结果, 选择合 适的目的节点进行 数据查询, 即选择合 适的跟随者节点。 5.如权利要求4所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 所述数 据存储范围分区中每 个键值对的数据大小计算方式为: 其中, averageSize用于表示每个键值对的数据平均大小; rangetotal用于表示当前分区 所负责的数据总大小; rangekeys用于表示当前分区存 储的键值对数目。 6.如权利要求4所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 所述数 据存储范围分区中的每个键值对的数据大小通过直方图信息来计算, 每个直方图代表一个权 利 要 求 书 1/2 页 2 CN 115378947 A 2Range, 其横轴的长度表 示Range内包含的键值对个数, 纵轴的长度表述当前R ange存储的数 据量大小, 根据存储的键值对个数不同, 可计算得到每个R ange分区中键值对数据的平均值 大小。 7.如权利要求5或6所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 所 述步骤S3'中, 节点通过Raft 集群的领导者节 点和跟随者节 点, 与存储层之间数据处理过程 的耗时计算方式为: 其中, QueryLeader用于表示通过领导者节点进行查询的总时间消耗; Qu eryFollower用于表 示通过跟随者节 点进行查询的总时间消耗; CostC‑L用于表示计算节点与领导者传输的网络 消耗; CostL‑C用于表示领导者与计算节点传输的网络消耗; CostC‑F用于表示计算节点与跟 随者传输的网络消耗; CostF‑C用于表示跟随者与计算节点传输的网络消耗; resultSize用于 表示查询结果集预估 大小; CostF‑L用于表示领导者节 点与跟随者节 点网络消耗; λ用于表 示 磁盘读取数据的消耗; 用于表示查询 结果集在领导者与计算节点 的传输过程中的时延消耗; 用于表示查询结果集在跟随者与计算 节点的传输过程中的时延消耗。 8.如权利要求7所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 节点与 领导者传输的网络消耗值CostC‑L、 领导者与计算节点传输的网络消耗值CostL‑C、 节点与跟 随者传输的网络消耗值CostC‑F、 跟随者与计算节 点传输的网络消耗值CostF‑C均采取定时轮 询的方式获取; 所述领导者节点与跟 随者节点网络消耗值CostF‑L, 若两个节点位于不同的机房时, 其 CostF‑L取值范围在15 ‑50ms; 若两个节点 位于相同机房, 取值 为0.1‑0.25ms。 9.如权利要求8所述的面向分布式存储系统的查询负载均衡方法, 其特征在于: 所述磁 盘读取数据的消耗 值 λ与存储节点磁 盘类型及查询数据量大小相关, 具体为: λ=resultSize* νread 其中, νread表示磁盘的读取速率。权 利 要 求 书 2/2 页 3 CN 115378947 A 3

.PDF文档 专利 面向分布式存储系统的查询负载均衡方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向分布式存储系统的查询负载均衡方法 第 1 页 专利 面向分布式存储系统的查询负载均衡方法 第 2 页 专利 面向分布式存储系统的查询负载均衡方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:15:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。