说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210312276.8 (22)申请日 2022.03.28 (71)申请人 北京计算机技 术及应用研究所 地址 100854 北京市海淀区永定路51号 (72)发明人 赵漫菲 储一光 王浩枫  (74)专利代理 机构 中国兵器 工业集团公司专利 中心 11011 专利代理师 刘瑞东 (51)Int.Cl. G06F 9/50(2006.01) G06F 9/451(2018.01) H04L 69/164(2022.01) (54)发明名称 一种基于MPICH+OPENMP的国产化并行计算 架构和方法 (57)摘要 本发明涉及一种基于MPICH+OPENMP的国产 化并行计算架构和方法, 属于并行计算领域。 本 发明基于MPICH+OpenMP混合架构构建, 通过实现 对于计算算法的混合并行加速达到提高计算效 率的效果。 基于MPICH并行架构的粗粒并行实现 节点间的并行计算, 包含节点间的任务分发, 数 据汇集同步等功能。 基于OpenMP并行架构的细粒 并行计算实现节点内部CPU核之间的算法层面的 并行计算。 并行加速平台可灵活应用于飞腾、 龙 芯等国产硬件平台, 中标麒麟、 银河麒麟等国产 操作系统。 本发 明可以根据并行计算节点系统资 源自动调整并行线程数量实现分配并行线程实 现算力的最大化利用, 相比传统MPI并行拥有更 好的稳定性与灵活性, 同时弥补了OpenMP只支持 单一计算节点的缺 点。 权利要求书2页 说明书6页 附图3页 CN 114756364 A 2022.07.15 CN 114756364 A 1.一种基于MPICH+OPENMP的国产化并行计算架构, 其特征在于, 该架构包括上位机客 户端与并行计算节点; 上位机客户端包括Qt图形界面模块和网络通信模块, 用于与并行计算节点进行通讯, 运行计算任务, 通过向并行计算节点请求计算服务, 获得计算结果, 通过图形界面显示计算 结果; 其中, QT图形界面模块实现了计算结果、 计算时间、 连接情况的图形化显示; 网络通信模块用于实现UD P通信客户端的搭建, 以及消息的打包、 解包和转发; 并行计算节点包括多台国产并行计算节点, 其中包括主计算节点与分支计算节点, 每 个计算节 点包括网络服务器端、 MPI粗粒并行计算模块、 OpenMP细粒并行计算模块以及算法 模块; 用于 接收计算 服务、 统计算力、 计算工作分配、 执 行具体算法以及汇集计算结果; 网络服务器端实现了UDP通信服务器端 的搭建, 与UDP通信客户端建立通信, 实现消息 的打包、 解包和转发; MPI粗粒并行计算模块, 用于区分主计算节点与分支计算节点, 统计并行计算节点的总 数量, 实现分支计算节点、 主计算节点在并行计算时的通信与同步; OpenMP细粒并行计算模块用于统计本节点CPU核数量, 设置细粒并行计算使用的线程 数量, 将多组算法根据线程数量进行分组, 由细粒并行计算线程实现细粒并行; 算法模块用于执行并行计算使用的算法, 被OpenMP细粒并行计算线程调用执行, 通过 接口与细粒并行线程进行交 互。 2.如权利 要求1所述的基于MPICH+OPENMP的国产 化并行计算架构, 其特征在于, 各计算 节点通过MPI并行网络通信。 3.如权利 要求1所述的基于MPICH+OPENMP的国产 化并行计算架构, 其特征在于, 上行接 口和下行接口使用不同的网络端口。 4.如权利 要求1所述的基于MPICH+OPENMP的国产 化并行计算架构, 其特征在于, 计算请 求包括算法类型目标 数和坐标 数据, 计算结果包括结果数据及计算消耗的时间。 5.如权利 要求1所述的基于MPICH+OPENMP的国产 化并行计算架构, 其特征在于, 所述计 算节点采用飞腾2000+ARM架构CPU、 龙芯MPIS架构CP U或intel/A MDx86架构CPU, 运行于支持 MPICH3.4.2、 GC C9.2.0的国产L inux操作系统。 6.如权利 要求1所述的基于MPICH+OPENMP的国产 化并行计算架构, 其特征在于, 客户端 可运行于W indows或支持qt13.4以上的L inux操作系统。 7.一种基于权利要求1 ‑6任一项的架构的基于MPICH+OPENMP的国产化并行计算方法, 其特征在于, 该 方法包括如下步骤: S11、 并行计算节点 通过接口接收来自客户端的计算请求; S12、 计算请求经转译发送给主计算节点, 主计算节点根据请求实现并行计算节点间的 MPI粗粒并行散播, 将计算任务给 各分支计算节点; S13、 各分支计算节点节点根据计算任务与节点硬件资源, 分配 并行任务执行OpenMP细 粒并行计算; S14、 细粒并行计算结果经由MPI 粗粒并行汇集到主计算节点; S15、 主计算节点经由上 行接口将计算结果发送到客户端, 客户端显示计算结果。 8.如权利 要求7所述的基于MPICH+OPENMP的国产 化并行计算方法, 其特征在于, 在步骤权 利 要 求 书 1/2 页 2 CN 114756364 A 2S11之前还包括如下步骤: S21、 在所有节点 安装银河麒 麟操作系统; S22、 在所有节点 安装GCC9.2.0编译器、 OpenS SH1.0.2和s sh‑askpass; S23、 在所有节点配置s sh免密登录并在hosts文件中设置计算节点 IP; S24、 在所有节点编译mpic h并行计算环境; S25、 在所有节点使用mpic h混合编译计算框架与算法代码。 9.一种基于权利要求1 ‑6任一项的架构的基于MPICH+OPENMP的国产化并行计算方法, 其特征在于, 该 方法包括如下步骤: S31、 各计算节点系统启动初始化并行环境, 统计 计算节点数与计算节点计算资源; 其中, 具体包括: 对MPI、 Op enMP并行环境的初始化, 国产 化平台服务器端并行计算缓冲 区的初始化, 统计并行计算节点数量和CPU内核的数量, 基础变量初始化; S32、 并行计算主节点建立网络服 务器线程, 等待客户端发出的计算请求 并行计算主计算节点建立UDP服务器等待来自客户端的消息, 收到有效消息后重新打 包转发到 MPI并行计算的主 线程; S33、 根据收到计算请求 生成计算命令, 之后散播到各分支计算节点 主计算节点根据收到的计算请求和节点数, 生成计算命令散播到所有分支计算节点; 计算命令目标数量的分配原则是基于节点数量与各节点CPU可以使用核的数量; 计算命令 通过MPI并行网络 散播到各分支计算节点; S34、 各分支计算节点接收到 散播的命令后, 开始调用算法执 行细粒并行计算 各分支计算节点在接收到散播的计算命令后, 根据CPU可用核数量设置OpenMP并行线 程数量,并拆分根据线程数量拆分计算命令, 根据计算命令调用需要做并行 的算法生成循 环后, 使用OpenMP并行执行算法循环并将结果转存到国产化平台服务器端的缓冲区; 每个 可用的CPU内核执 行并行拆分后的计算命令; S35、 汇集计算结果 利用MPI汇集操作将各分支计算节点的计算结果汇集到主计算节点的缓冲区; S36、 发送计算结果 主计算节点将缓冲区中的计算结果转为计算结果消息经上行接口发往客户端, 客户端 显示计算结果与计算时间。 10.如权利要求9所述的基于MPICH+OPENMP的国产化并行计算方法, 其特征在于, 在步 骤S31之前还 包括如下步骤: S21、 在所有节点 安装银河麒 麟操作系统; S22、 在所有节点 安装GCC9.2.0编译器、 OpenS SH1.0.2和s sh‑askpass; S23、 在所有节点配置s sh免密登录并在hosts文件中设置计算节点 IP; S24、 在所有节点编译mpic h并行计算环境; S25、 在所有节点使用mpic h混合编译计算框架与算法代码。权 利 要 求 书 2/2 页 3 CN 114756364 A 3

.PDF文档 专利 一种基于MPICH+OPENMP的国产化并行计算架构和方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于MPICH+OPENMP的国产化并行计算架构和方法 第 1 页 专利 一种基于MPICH+OPENMP的国产化并行计算架构和方法 第 2 页 专利 一种基于MPICH+OPENMP的国产化并行计算架构和方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:22:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。