学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
大规模有限元系统的GPU加速计算研究
被引:48
作者
:
论文数:
引用数:
h-index:
机构:
刘小虎
论文数:
引用数:
h-index:
机构:
胡耀国
符伟
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学力学系
符伟
机构
:
[1]
华中科技大学力学系
来源
:
计算力学学报
|
2012年
/ 29卷
/ 01期
关键词
:
GPU计算;
有限元;
共轭梯度法;
并行计算;
CUDA;
D O I
:
暂无
中图分类号
:
O241.82 [偏微分方程的数值解法];
TP391.41 [];
学科分类号
:
070102
[计算数学]
;
摘要
:
研究了GPU(Graphics Processing Units)计算应用于有限元方法中的总刚计算和组装、稀疏矩阵与向量乘积运算、线性方程组求解问题,并基于CUDA(Compute Unified Device Architecture)平台利用GTX295GPU进行程序实现和测试。系统总刚采用CSR(Compressed Sparse Row)压缩格式存放于GPU显存中,用单元染色方法实现总刚并行计算组装,用共轭梯度迭代法求解大规模线性方程组。对300万自由度以内的空间桁架和平面问题算例,GPU有限元计算分别获得最高9.5倍和6.5倍的计算加速比,并且加速比随系统自由度的增加而近似线性增加,GFLOP/s峰值也有近10倍的增加。
引用
收藏
页码:146 / 152
页数:7
相关论文
共 4 条
[1]
High-performance cone beam reconstruction using CUDA compatible GPUs.[J].Yusuke Okitsu;Fumihiko Ino;Kenichi Hagihara.Parallel Computing.2010, 2
[2]
基于OpenMP的三维显式物质点法并行化研究
[J].
论文数:
引用数:
h-index:
机构:
黄鹏
;
论文数:
引用数:
h-index:
机构:
张雄
;
论文数:
引用数:
h-index:
机构:
马上
;
论文数:
引用数:
h-index:
机构:
王汉奎
.
计算力学学报,
2010,
27
(01)
:21
-27
[3]
基于核重构思想的配点型无网格方法的研究——一维问题
[J].
论文数:
引用数:
h-index:
机构:
史宝军
;
论文数:
引用数:
h-index:
机构:
袁明武
;
论文数:
引用数:
h-index:
机构:
孙树立
;
论文数:
引用数:
h-index:
机构:
陈斌
.
计算力学学报,
2004,
(01)
:97
-103
[4]
一种新的墙单元
[J].
论文数:
引用数:
h-index:
机构:
袁明武
;
论文数:
引用数:
h-index:
机构:
孙树立
;
论文数:
引用数:
h-index:
机构:
蔡定正
.
计算结构力学及其应用,
1996,
(01)
:17
-24
←
1
→
共 4 条
[1]
High-performance cone beam reconstruction using CUDA compatible GPUs.[J].Yusuke Okitsu;Fumihiko Ino;Kenichi Hagihara.Parallel Computing.2010, 2
[2]
基于OpenMP的三维显式物质点法并行化研究
[J].
论文数:
引用数:
h-index:
机构:
黄鹏
;
论文数:
引用数:
h-index:
机构:
张雄
;
论文数:
引用数:
h-index:
机构:
马上
;
论文数:
引用数:
h-index:
机构:
王汉奎
.
计算力学学报,
2010,
27
(01)
:21
-27
[3]
基于核重构思想的配点型无网格方法的研究——一维问题
[J].
论文数:
引用数:
h-index:
机构:
史宝军
;
论文数:
引用数:
h-index:
机构:
袁明武
;
论文数:
引用数:
h-index:
机构:
孙树立
;
论文数:
引用数:
h-index:
机构:
陈斌
.
计算力学学报,
2004,
(01)
:97
-103
[4]
一种新的墙单元
[J].
论文数:
引用数:
h-index:
机构:
袁明武
;
论文数:
引用数:
h-index:
机构:
孙树立
;
论文数:
引用数:
h-index:
机构:
蔡定正
.
计算结构力学及其应用,
1996,
(01)
:17
-24
←
1
→