(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211110195.6
(22)申请日 2022.09.13
(65)同一申请的已公布的文献号
申请公布号 CN 115202889 A
(43)申请公布日 2022.10.18
(73)专利权人 阿里巴巴 (中国) 有限公司
地址 311121 浙江省杭州市余杭区五常街
道文一西路969号3幢5层5 54室
(72)发明人 杨定裕 张东祥 肖子洋
(74)专利代理 机构 北京开阳星知识产权代理有
限公司 1 1710
专利代理师 张子青
(51)Int.Cl.
G06F 9/50(2006.01)(56)对比文件
CN 106961351 A,2017.07.18
CN 1089843 01 A,2018.12.1 1
CN 111356148 A,2020.0 6.30
US 2020097358 A1,2020.0 3.26
US 20121370 02 A1,2012.0 5.31
CN 110247856 A,2019.09.17
US 1084123 6 B1,2020.1 1.17
CN 111026553 A,2020.04.17
CN 10980 0075 A,2019.0 5.24
CN 107404 409 A,2017.1 1.28
乐振浒等.互联网系统应对突发性高压力的
过载保护研究. 《信息系统工程》 .2017,(第08
期),
审查员 荆苏丹
(54)发明名称
计算资源调整方法及计算系统
(57)摘要
本公开涉及一种计算资源调整方法及计算
系统。 本公开通过将目标集群在每个历史时间接
收的请求数量分解为非突发性负载数量和突发
性负载数量, 并根据多个历史时间分别对应的非
突发性负载数量预测下一时间的非突发性负载
数量, 以及根据多个历史时间分别对应的突发性
负载数量预测下一时间的突发性负载数量。 从而
精确的预测出下一时间的请求数量。 根据下一时
间的请求数量, 在满足在线服务的响应时间小于
或等于预设阈值的条件下, 预测在线服务在下一
时间所需的计算资源的最小值, 并根据该最小值
调整离线任务在下一时间使用的计算资源的最
大值。 从而在突发性负载的场景下, 也可 以动态
调整离线任务的计算资源的限额, 提高了整体的
资源利用率。
权利要求书3页 说明书15页 附图6页
CN 115202889 B
2022.12.09
CN 115202889 B
1.一种计算资源调整方法, 其中, 所述方法包括:
获取目标集群在多个历史时间分别 接收的请求数量, 每个历史时间的请求数量包括非
突发性负载 数量和突发性负载 数量;
根据所述多个历史时间分别对应的非突发性负载数量预测下一时间的非突发性负载
数量, 以及根据所述多个历史时间分别对应的突 发性负载数量预测下一时间的突 发性负载
数量;
根据所述下一 时间的非突发性负载数量和所述下一 时间的突发性负载数量, 预测所述
下一时间的请求数量;
根据所述下一 时间的请求数量, 预测所述目标集群中的在线服务在所述下一 时间所需
的计算资源的最小值, 所述 最小值使得 所述在线服 务的响应时间小于或等于预设阈值;
根据所述最小值, 调整所述目标集群中的离线任务在所述下一 时间使用的计算资源的
最大值;
根据所述多个历史时间分别对应的非突发性负载数量预测下一时间的非突发性负载
数量, 包括:
确定由所述多个历史时间分别对应的非突发性负载 数量构成的曲线中的多个 变化点;
根据所述多个变化点中的最后一个变化点对应的历史时间和当前时间之间的非突发
性负载数量, 拟合非突发性负载 数量和任一时间之间的第一关联关系;
根据所述第一关联关系预测所述下一时间的非突发性负载 数量;
根据所述下一 时间的请求数量, 预测所述目标集群中的在线服务在所述下一 时间所需
的计算资源的最小值, 包括:
确定所述在线服务对应的请求数量、 所述在线服务对应的计算资源和所述在线服务的
响应时间之间的映射关系;
将所述下一 时间的请求数量作为所述映射关系中的请求数量, 得到所述在线服务对应
的计算资源和所述在线服 务的响应时间之间的第三关联关系;
根据所述第三关联关系, 预测所述在线服务在所述下一时间所需的计算资源的最小
值。
2.根据权利要求1所述的方法, 其中, 所述方法还 包括:
根据所述第 一关联关系, 计算所述多个历史时间分别对应的非突发性负载数量的估计
值;
根据所述多个历史时间分别对应的请求数量、 以及所述多个历史时间分别对应的非突
发性负载 数量的估计值, 更新所述第一关联关系中的参数。
3.根据权利要求1所述的方法, 其中, 根据 所述多个历史时间分别对应的突发性负载数
量预测下一时间的突发性负载 数量, 包括:
预测所述下一时间是否有突发事 件发生;
若所述下一 时间有突发事件发生, 则根据 所述多个历史时间分别对应的突发性负载数
量预测所述下一时间的突发性负载 数量。
4.根据权利要求1或3所述的方法, 其中, 根据所述多个历史时间分别对应的突发性负
载数量预测所述下一时间的突发性负载 数量, 包括:
根据泊松分布、 以及所述多个历史时间分别对应的突发性负载数量, 拟合突发性负载权 利 要 求 书 1/3 页
2
CN 115202889 B
2数量和任一时间之间的第二关联关系;
根据所述第二关联关系预测所述下一时间的突发性负载 数量。
5.根据权利要求 4所述的方法, 其中, 所述方法还 包括:
根据所述第二关联关系, 计算所述多个历史时间分别对应的突发性负载数量的估计
值;
根据所述多个历史时间分别对应的请求数量、 以及所述多个历史时间分别对应的突发
性负载数量的估计值, 更新所述第二关联关系中的参数。
6.根据权利要求1所述的方法, 其中, 确定所述在线服务对应的请求数量、 所述在线服
务对应的计算资源和所述在线服 务的响应时间之间的映射关系, 包括:
构建第一机器学习模型, 所述第 一机器学习 模型的输入包括所述在线服务对应的请求
数量和所述在线服务对应的计算资源, 所述第一机器学习模型的输出是所述映射关系中的
第一参数;
构建第二机器学习模型, 所述第 二机器学习 模型的输入包括所述在线服务对应的请求
数量和所述在线服务对应的计算资源, 所述第二机器学习模型的输出是所述映射关系中的
第二参数;
根据所述映射关系对应的样本数据对所述第一机器学习模型和所述第二机器学习模
型进行训练;
根据训练后的所述第 一机器学习模型确定所述第 一参数, 根据训练后的所述第 二机器
学习模型确定所述第二 参数;
根据所述第一参数和所述第二参数, 确定所述在线服务对应的请求数量、 所述在线服
务对应的计算资源和所述在线服 务的响应时间之间的映射关系。
7.根据权利要求2所述的方法, 其中,
所述第一关联关系表示为 g(t)=ωt+b, g(t)表示非突发性负载数量, t表示时间, ω和b
分别表示 参数;
根据所述多个历史时间分别对应的请求数量、 以及所述多个历史时间分别对应的非突
发性负载 数量的估计值, 更新所述第一关联关系中的参数, 包括:
根据
, 更新ω和b,
表示第t个历史时间窗
口内QPS (t) 的实际值, QPS(t)=g(t)+e(t), e(t)表示突发性负载数量, n表示历史时间窗口
的个数,
表示g(t)的估计值,
表示参数。
8.根据权利要求5所述的方法, 其中,
所述第二关联关系包括e(t)=Ib•b(t)和
, e(t)表示突发性负载 数量, t
表示时间, b(t)表示突发性工作负载, Ib为1时表示所述下一时间有突发事件发生, B和 λ分
别是未知的参数;
根据所述多个历史时间分别对应的请求数量、 以及所述多个历史时间分别对应的突发
性负载数量的估计值, 更新所述第二关联关系中的参数, 包括:
根据
, 更新B和λ,
表示第t个历史时间窗口
内QPS (t) 的实际值, QPS(t)=g(t)+e(t), e(t)表示突发性负载数量, n表示历史时间窗口的权 利 要 求 书 2/3 页
3
CN 115202889 B
3
专利 计算资源调整方法及计算系统
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:15:18上传分享