返回学校首页

研究亮点

当前位置:首页 / 研究亮点

李菲:基于GPU集群的浅积云对流参数化方案异构并行计算【FGCS,2023】

发布时间:2023-10-30       阅读:7

近年来,数值天气预报逐渐向全球公里级,重点区域百米级方向发展,气候模式分辨率不断提高,对计算资源的需求也越来越大。在计算资源有限的情况下,如何发展高效率的气候模式成为了大气科学领域中越来越受关注的一个问题。大气积云对流物理过程在气候建模中起着至关重要的作用,其复杂的计算过程严重制约着高分辨率气候模式的发展。在气候模式中,加速计算积云对流过程是一个重大挑战。因此,发展一种高效的积云对流参数化方案具有重要价值。

针对以上问题,我校信息工程学院硕士生李菲在王玉柱副教授的指导下,选取华盛顿大学浅层积云对流参数化方案(UWshcu)为研究对象,提出了适用于大规模异构超算系统的并行算法,使其能够同时利用超算的CPUGPU进行加速计算。主要创新点如下:

1. 首次基于“CPU+GPU”异构计算的方式提出UWshcu在水平维度上的并行算法,并对算法进行全局内存访问优化以及使用主机钉固内存进行数据传输优化,极大提升了UWshcu计算效率。

2. 基于MPI+CUDAMPI+HIP混合并行编程模型来加速UWshcu。该异构加速算法能够利用超算多GPU的优势,满足高分辨率气候模型对大规模计算资源的需求。

3. 通过MPI+OpenMP+HIPMOH)三级混合并行编程模型进一步优化了UWshcu的异构算法,实现了节点内计算资源的充分利用。此外,提出了一种合理划分CPUGPU计算负载的算法,可以最小化UWshcu的计算时间。

图1 UWshcu结构示意图   

  图2 UWshcu并行算法

图3 MPI+CUDA混合编程模型 

  图4 UWshcu物理空间的二级并行结构划分

图5 UWshcu基于MOH编程模型的实现

图6 UWshcu基于多核CPU的并行算法和基于GPU的异构并行算法在使用不同数量节点时的运行时间

上述研究成果发表于计算机科学领域国际权威期刊《Future Generation Computer Systems》上:Fei Li, Yuzhu Wang*, Jinrong Jiang, et al. Heterogeneous acceleration algorithms for shallow cumulus convection scheme over GPU clusters[J]. Future Generation Computer Systems, 2023, 146: 166-177. [IF2022=7.5]

全文链接:https://doi.org/10.1016/j.future.2023.04.021