基于移动多核GPU的并行二维DCT变换实现方法

被引:2
作者
龚若皓
杨斌
机构
[1] 西南交通大学信息科学与技术学院
关键词
计算机应用技术; 异构计算; 二维DCT变换; 移动多核GPU; GPGPU; OpenCL; 并行化;
D O I
10.16836/j.cnki.jcuit.2015.01.005
中图分类号
TP391.41 []; TP332 [运算器和控制器(CPU)];
学科分类号
080203 ; 081201 ;
摘要
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。
引用
收藏
页码:22 / 26
页数:5
相关论文
共 10 条
[1]   面向OpenCL模型的DCT并行化 [J].
向阳霞 ;
张惠民 ;
王子强 .
电脑知识与技术, 2013, 9 (26) :6007-6011
[2]   面向OpenCL模型的GPU性能优化 [J].
陈钢 ;
吴百锋 .
计算机辅助设计与图形学学报, 2011, (04) :571-581
[3]   GPU通用计算平台上的SPH流体模拟 [J].
温婵娟 ;
欧嘉蔚 ;
贾金原 .
计算机辅助设计与图形学学报, 2010, (03) :406-411
[4]   应用GPU集群加速计算蛋白质分子场 [J].
张繁 ;
王章野 ;
姚建 ;
吴韬 ;
彭群生 .
计算机辅助设计与图形学学报, 2010, (03) :412-419
[5]   GPU加速的基于增量式聚类的视频拷贝检测方法 [J].
任化敏 ;
张勇东 ;
林守勋 .
计算机辅助设计与图形学学报, 2010, 22 (03) :449-456
[6]   GPU加速的生物序列比对 [J].
林江 ;
唐敏 ;
童若锋 .
计算机辅助设计与图形学学报, 2010, 22 (03) :420-427
[7]   基于CUDA的DCT快速变换实现方法 [J].
阮军 ;
韩定定 .
微电子学与计算机, 2009, 26 (08) :201-205+210
[8]   基于图形处理器(GPU)的通用计算 [J].
吴恩华 ;
柳有权 .
计算机辅助设计与图形学学报, 2004, (05) :601-612
[9]   A survey of general-purpose computation on graphics hardware [J].
Owens, John D. ;
Luebke, David ;
Govindaraju, Naga ;
Harris, Mark ;
Krueger, Jens ;
Lefohn, Aaron E. ;
Purcell, Timothy J. .
COMPUTER GRAPHICS FORUM, 2007, 26 (01) :80-113
[10]  
Sparse matrix solvers on the GPU[J] . Jeff Bolz,Ian Farmer,Eitan Grinspun,Peter Schr?oder.ACM Transactions on Graphics (TOG) . 2003 (3)