共 3 条
多图形处理器上Lattice-Boltzmann方法的加速
被引:2
作者:
吴亮
[1
]
钟诚文
[1
,2
]
郑彦奎
[1
]
刘沙
[2
]
卓丛山
[2
]
陈效鹏
[3
]
机构:
[1] 西北工业大学高性能计算研究与发展中心
[2] 西北工业大学翼型、叶栅空气动力学国防科技重点实验室
[3] 西北工业大学力学与土木建筑学院
关键词:
CUDA;
多线程技术;
Lattice Boltzmann方法;
多图形处理器;
信号量;
并行计算;
D O I:
暂无
中图分类号:
TP332 [运算器和控制器(CPU)];
学科分类号:
081201 ;
摘要:
为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用图形硬件的并行性,提出一种在单机多图形处理器下基于CUDA架构的Lattice Boltzmann方法(LBM)的模拟算法.采用区域划分策略将域上的LBM网格平均分配到不同的GPU设备上,在分区边界处搭接一层网格以方便计算该处网格的迁移过程,减少GPU间的通信量,并合理地利用CUDA存储层次架构中的全局内存和纹理内存为计算网格分配设备空间;采用多线程技术,用每个线程控制不同的GPU设备,同时引入线程同步机制信号量实现线程间的数据通信同步控制,按照LBM方程组的求解过程实现模拟计算.实验结果表明,双GPU将计算加速到单GPU的1.77倍左右,同时将流场计算网格规模从单GPU下的4160×4160扩大到双GPU下的6144×6144.
引用
收藏
页码:1932 / 1939
页数:8
相关论文