从图形处理器到基于GPU的通用计算

被引:7
作者
刘金硕 [1 ]
刘天晓 [1 ]
吴慧 [1 ]
曾秋梅 [1 ]
任梦菲 [2 ]
顾宜淳 [2 ]
机构
[1] 武汉大学计算机学院
[2] 武汉大学国际软件学院
关键词
GPGPU; CUDA架构; 并行计算;
D O I
10.14188/j.1671-8836.2013.02.016
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
对GPU(graphic process unit)、基于GPU的通用计算(general purpose GPU,GPGPU)、基于GPU的编程模型与环境进行了界定;将GPU的发展分为4个阶段,阐述了GPU的架构由非统一的渲染架构到统一的渲染架构,再到新一代的费米架构的变化;通过对基于GPU的通用计算的架构与多核CPU架构、分布式集群架构进行了软硬件的对比.分析表明:当进行中粒度的线程级数据密集型并行运算时,采用多核多线程并行;当进行粗粒度的网络密集型并行运算时,采用集群并行;当进行细粒度的计算密集型并行运算时,采用GPU通用计算并行.最后本文展示了未来的GPGPU的研究热点和发展方向——GPGPU自动并行化、CUDA对多种语言的支持、CUDA的性能优化,并介绍了GPGPU的一些典型应用.
引用
收藏
页码:198 / 206
页数:9
相关论文
共 10 条
[1]   图形处理器的历史现状和发展趋势 [J].
韩俊刚 ;
刘有耀 ;
张晓 .
西安邮电学院学报, 2011, 16 (03) :61-64
[2]   曙光“星云”超千万亿次的突破 [J].
李明 .
网络安全技术与应用, 2010, (07) :4-4
[3]   “天河一号”超级计算机系统研制 [J].
王握文 ;
陈明 .
国防科技, 2009, 30 (06) :1-4
[4]   基于Brook在GPU的应用 [J].
刘振林 ;
黄永忠 ;
王磊 ;
刘晓楠 .
信息工程大学学报, 2008, (01) :80-84
[5]  
基于GPU的实时红外图像生成方法研究[D]. 李勇.西安电子科技大学 2007
[6]  
GPU高性能运算之CUDA[M]. 中国水利水电出版社 , 张舒, 2009
[7]   Multi-GPU performance of incompressible flow computation by lattice Boltzmann method on GPU cluster [J].
Xian, Wang ;
Takayuki, Aoki .
PARALLEL COMPUTING, 2011, 37 (09) :521-535
[8]  
Sparse matrix solvers on the GPU[J] . Jeff Bolz,Ian Farmer,Eitan Grinspun,Peter Schr?oder.ACM Transactions on Graphics (TOG) . 2003 (3)
[9]  
GPU acceleration of numerical weather prediction. Michalakes J,Vachharajani M. Parallel Processing Letters . 2008
[10]  
Tesla Bio Workbench—Enabling New Sci-ence. NVIDIA. http://www.nvidia.com/object/teslabioworkbench.html . 2011