摘要:本研究从CFD实际应用背景出发,综合多核与众核的特点,采用OpenMP 线程嵌套以实现CPU/GPU 的协同
并行计算,实现了雅可比迭代法的GPU 加速以及OpenMP/CUDA 混合并行算法,并将其用于结构网格气动外流场的
数值模拟。对单区200 万结构网格数据,右端项、左端项矩阵及矩阵求逆、雅可比迭代等核心计算部分的GPU 并
行分别取得了11.35、13.83 和8.34 倍的加速比,整个求解过程取得了9.86 倍的加速比;对200 万4 区结构网
格数据,整个求解过程的GPU 并行加速比为5.56,CPU/GPU 协同并行的加速比为7.49。
关键词:雅可比迭代;图形处理器;计算流体力学;天河-1A;异构混合并行

作者:李大力,张理论,徐传福,刘巍
(国防科学技术大学计算机学院,湖南长沙410073)