(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211149183.4
(22)申请日 2022.09.21
(65)同一申请的已公布的文献号
申请公布号 CN 115242660 A
(43)申请公布日 2022.10.25
(73)专利权人 之江实验室
地址 311121 浙江省杭州市余杭区之江实
验室南湖总部
(72)发明人 朱世强 潘爱民 林露 高翔
(74)专利代理 机构 北京志霖恒远知识产权代理
有限公司 1 1435
专利代理师 戴莉
(51)Int.Cl.
H04L 41/14(2022.01)
H04L 41/02(2022.01)
G06F 9/50(2006.01)(56)对比文件
CN 113839814 A,2021.12.24
CN 113033082 A,2021.0 6.25
CN 114064278 A,202 2.02.18
CN 114868113 A,202 2.08.05
US 20213 65290 A1,2021.1 1.25
US 20212 25463 A1,2021.07.2 2
miguel cabal ler et al. .Deployment of
elastic virtual hybrid clusters acros s
cloud sites. 《hournal of grid computi ng》
.2021,第1-10页.
乔秀全等.面向6G的去中心化的人工智能理
论与技术. 《移动通信》 .2020,(第0 6期),第125 -
129页.
马涛等.勘探开发梦 想云平台架构设计与实
现. 《中国石油勘探》 .2020,(第0 5期),第75 -85
页.
审查员 李亚楠
(54)发明名称
基于中心化的异构算力联邦系统及组网和
执行方法
(57)摘要
本发明公开了基于中心化的异构算力联邦
系统及组网和执行方法, 其中所述异构算力联邦
系统架构总体上分为2层: 视图层和资源层。 在视
图层包含2个模块: 异构算力联邦服务模块和异
构算力联邦控制模块; 在资源层中包含2 个模块:
异构算力集群管理模块和异构算力联邦探针模
块。 根据上述架构, 异构算力集群进行组网: 首先
在在异构算力集群管理模块部署异构算力联邦
探针模块; 然后在异构算力联邦控制模块创建异
构算力集群描述模型; 之后异构算力联邦探针模
块收集异构算力集群信息推送到异构算力联邦
控制模块; 最后由异构算力联邦控制模块填充异
构算力集群资源描述模型, 完成异构算力联邦系
统的统一 算力视图。
权利要求书2页 说明书6页 附图3页
CN 115242660 B
2022.12.13
CN 115242660 B
1.一种基于 中心化的异构算力联邦系统, 其特征在于: 包括视图层和资源层, 所述视图
层内设有异构算力联邦服 务模块和异构算力联邦控制模块;
所述异构算力联邦服务模块基于异构算力联邦控制模块存储的异构算力集群资源描
述模型, 对外提供统一的异构算力使用接口; 所述异构算力集群资源描述模型包含异构算
力集群元 数据, 异构算力集群资源数据和异构算力集群 状态数据;
所述异构算力联邦控制模块接收来自异构算力联邦探针模块的信 息推送, 填充异构算
力集群资源描述模型, 形成异构算力 资源的统一视图; 接 收来自异构算力联邦服务模块的
异构算力使用请求, 并根据异构算力资源的统一视图将异构算力使用请求转 发到异构算力
联邦探针模块;
所述资源层内设有异构算力联邦 探针模块和异构算力集群管理模块;
所述异构算力联邦探针模块基于从异构算力管理模块获取的异构算力集群资源信 息,
并将其转换为异构算力集群资源描述模型的属性, 最后 将异构算力集群资源描述模型上报
给异构算力联邦控制模块;
所述异构算力集群管理模块由异构算力集群自行定义, 针对不同的异构算力集群存在
不同类型的异构算力集群管理模块, 不同的异构算力集群管理模块之 间的差异 性由异构算
力联邦探针模块分别适配解决。
2.如权利要求1所述的一种基于 中心化的异构算力联邦系统, 其特征在于: 所述异构算
力联邦服 务模块以API 业务网关的方式对外提供HT TP接口。
3.如权利要求1所述的一种基于 中心化的异构算力联邦系统, 其特征在于: 所述异构算
力联邦控制模块包括计算架构和 存储架构, 所述计算架构采用SpringMVC技术提供HTTP接
口, 包括作业创建接口、 查询作业列表接口、 查询作业详情接口、 删除作业接口、 申请集群资
源接口、 释放集群资源接口、 添加 集群信息接口、 更新集群信息接口和删除集群信息接口;
所述存储架构采用M ySQL数据库以表的形式存储, 包括作业表、 集群 资源表和集群 资源使用
记录表。
4.一种应用如权利要求1 ‑3任一项所述的联邦系统 的组网方法, 其特征在于, 具体包括
如下步骤:
S1、 在异构算力集群管理模块中部署适配该异构算力集群管理模块的异构算力联邦探
针模块, 使异构算力联邦探针模块与异构算力集群管理模块进行通信, 获取该异构算力集
群的资源信息;
S2、 在异构算力联邦控制模块创建异构算力集群资源描述模型, 所述异构算力集群资
源描述模型包 含异构算力集群元 数据, 异构算力集群资源数据和异构算力集群 状态数据;
S3、 异构算力联邦探针模块从异构算力集群管理模块获取异构算力集群资源信息, 将
异构算力集群资源信息转换为异构算力集群资源描述模型的属性, 最后将该异构算力集群
资源描述模型的数据上报给异构算力联邦控制模块; 异构算力联邦探针模块能够与 异构算
力联邦控制模块进行通信;
S4、 异构算力联邦控制模块接收到异构算力联邦探针模块周期性上报的异构算力集群
资源描述模型的数据后, 首先更新存储在异构算力联邦控制模块的异构算力集群资源描述
模型, 最后再重构异构算力资源的统一视图。
5.如权利要求4所述的联邦系统 的组网方法, 其特征在于, 所述异构算力集群元数据包权 利 要 求 书 1/2 页
2
CN 115242660 B
2括异构算力集群名称、 异构算力集群创建时间、 异构算力集群失效时间、 异构算力集群标签
和异构算力集群注解; 所述异构算力集群资源数据包括异构算力集群唯一标识、 异构算力
联邦探针类型、 异构算力集群管理接口、 异构算力集群地域、 异构算力集群分组、 异构算力
集群总CPU核数、 异构算力集群总GPU卡数、 异构算力集群总内存大小和异构算力集群节点
数; 所述异构算力集群状态数据包括异构算力集群管理模块版本、 异构算力集群已使用CPU
核数、 异构算力集群已使用GPU卡数、 异构算力集群已使用内存大小和异构算力集群已使用
节点数。
6.一种应用如权利要求1 ‑3任一项所述的联邦系统 的执行方法, 其特征在于, 具体包括
如下步骤:
A1、 算力需求方通过异构算力联邦服务模块提供的统一的异构算力使用接口提交计算
任务;
A2、 异构算力联邦服务模块将收到的计算任务提交到异构算力联邦控制模块, 异构算
力联邦控制模块根据计算任务的计算资源需求查询异构算力资源的统一视图, 获取一个异
构算力集群资源描述模型;
A3、 异构算力联邦服务模块根据该异构算力集群资源描述模型将计算任务转发到该异
构算力集群的异构算力联邦 探针模块;
A4、 异构算力联邦探针模块将收到的计算任务提交到异构算力集群管理模块, 由异构
算力集群管理模块将该计算任务分配到该异构算力集群的节点上 执行该计算任务。权 利 要 求 书 2/2 页
3
CN 115242660 B
3
专利 基于中心化的异构算力联邦系统及组网和执行方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:12:52上传分享