面向OpenCL模型的GPU性能优化

被引:20
作者
陈钢 [1 ,2 ]
吴百锋 [1 ]
机构
[1] 复旦大学计算机科学技术学院
[2] AMD先进微处理机技术实验室
关键词
OpenCL; GPU; 性能优化; 异构处理; 通用计算; 多面体表示;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
GPU的高性价比吸引了越来越多的通用计算.为充分发挥异构处理平台下GPU的通用计算能力,提出面向OpenCL模型的性能优化方法.该方法建立源程序的多面体表示,分别对GPU的全局存储器和快速存储器进行优化与分配;通过检测存储访问模式发掘可向量化的存储访问实例,利用数据空间变换对存储访问模式进行转换,进而使用向量数据类型提高片外存储器的带宽利用率;通过检测程序中的数据重用,根据数据的访问属性和OpenCL存储模型的特性实现快速存储器的有效分配与优化,提高了片上存储器的使用效率.采用文中方法对6个测试程序进行实验的结果表明,程序的性能提高了1.6~8.4倍,证实了其有效性.
引用
收藏
页码:571 / 581
页数:11
相关论文
共 9 条
[1]   GPU通用计算平台上的SPH流体模拟 [J].
温婵娟 ;
欧嘉蔚 ;
贾金原 .
计算机辅助设计与图形学学报, 2010, (03) :406-411
[2]   应用GPU集群加速计算蛋白质分子场 [J].
张繁 ;
王章野 ;
姚建 ;
吴韬 ;
彭群生 .
计算机辅助设计与图形学学报, 2010, (03) :412-419
[3]   GPU加速的基于增量式聚类的视频拷贝检测方法 [J].
任化敏 ;
张勇东 ;
林守勋 .
计算机辅助设计与图形学学报, 2010, 22 (03) :449-456
[4]   GPU加速的生物序列比对 [J].
林江 ;
唐敏 ;
童若锋 .
计算机辅助设计与图形学学报, 2010, 22 (03) :420-427
[5]   GPGPU性能模型及应用实例分析 [J].
韩博 ;
周秉锋 .
计算机辅助设计与图形学学报, 2009, (09) :1219-1226
[6]   基于图形处理器(GPU)的通用计算 [J].
吴恩华 ;
柳有权 .
计算机辅助设计与图形学学报, 2004, (05) :601-612
[7]  
GPUs: A Closer Look[J] . Kayvon Fatahalian,Mike Houston.Queue . 2008 (2)
[8]  
Data transformationsenabling loop vectorization on multithreaded data parallelarchitectures. Jang B,Mistry P,Schaa D,et al. Proceedings of the 15th ACM SIGPLANSymposium on Principles and Practice of ParallelProgramming . 2010
[9]  
Non-Singular Data Transformations: Defi- nition, Validity and Applications. O‘ Boyle M F P,Knijnenburg P M W. Proceedings of the 11th International Con- ference on Supercomputing . 1997