学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于移动多核GPU的并行二维DCT变换实现方法
被引:2
作者
:
论文数:
引用数:
h-index:
机构:
龚若皓
论文数:
引用数:
h-index:
机构:
杨斌
机构
:
[1]
西南交通大学信息科学与技术学院
来源
:
成都信息工程学院学报
|
2015年
/ 30卷
/ 01期
关键词
:
计算机应用技术;
异构计算;
二维DCT变换;
移动多核GPU;
GPGPU;
OpenCL;
并行化;
D O I
:
10.16836/j.cnki.jcuit.2015.01.005
中图分类号
:
TP391.41 [];
TP332 [运算器和控制器(CPU)];
学科分类号
:
080203 ;
081201 ;
摘要
:
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。
引用
收藏
页码:22 / 26
页数:5
相关论文
共 10 条
[1]
面向OpenCL模型的DCT并行化
[J].
向阳霞
论文数:
0
引用数:
0
h-index:
0
机构:
装甲兵工程学院信息工程系
向阳霞
;
张惠民
论文数:
0
引用数:
0
h-index:
0
机构:
装甲兵工程学院信息工程系
张惠民
;
王子强
论文数:
0
引用数:
0
h-index:
0
机构:
装甲兵工程学院信息工程系
王子强
.
电脑知识与技术,
2013,
9
(26)
:6007
-6011
[2]
面向OpenCL模型的GPU性能优化
[J].
论文数:
引用数:
h-index:
机构:
陈钢
;
论文数:
引用数:
h-index:
机构:
吴百锋
.
计算机辅助设计与图形学学报,
2011,
(04)
:571
-581
[3]
GPU通用计算平台上的SPH流体模拟
[J].
论文数:
引用数:
h-index:
机构:
温婵娟
;
论文数:
引用数:
h-index:
机构:
欧嘉蔚
;
论文数:
引用数:
h-index:
机构:
贾金原
.
计算机辅助设计与图形学学报,
2010,
(03)
:406
-411
[4]
应用GPU集群加速计算蛋白质分子场
[J].
张繁
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学CAD & CG国家重点实验室
浙江工业大学计算机学院
浙江大学CAD & CG国家重点实验室
张繁
;
王章野
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学CAD & CG国家重点实验室
浙江大学CAD & CG国家重点实验室
王章野
;
论文数:
引用数:
h-index:
机构:
姚建
;
吴韬
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学理学院化学系
浙江大学CAD & CG国家重点实验室
吴韬
;
彭群生
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学CAD & CG国家重点实验室
浙江大学CAD & CG国家重点实验室
彭群生
.
计算机辅助设计与图形学学报,
2010,
(03)
:412
-419
[5]
GPU加速的基于增量式聚类的视频拷贝检测方法
[J].
论文数:
引用数:
h-index:
机构:
任化敏
;
张勇东
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所前瞻研究实验室
中国科学院计算技术研究所前瞻研究实验室
张勇东
;
林守勋
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所前瞻研究实验室
中国科学院计算技术研究所前瞻研究实验室
林守勋
.
计算机辅助设计与图形学学报,
2010,
22
(03)
:449
-456
[6]
GPU加速的生物序列比对
[J].
论文数:
引用数:
h-index:
机构:
林江
;
论文数:
引用数:
h-index:
机构:
唐敏
;
童若锋
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学计算机科学与技术学院
童若锋
.
计算机辅助设计与图形学学报,
2010,
22
(03)
:420
-427
[7]
基于CUDA的DCT快速变换实现方法
[J].
论文数:
引用数:
h-index:
机构:
阮军
;
论文数:
引用数:
h-index:
机构:
韩定定
.
微电子学与计算机,
2009,
26
(08)
:201
-205+210
[8]
基于图形处理器(GPU)的通用计算
[J].
吴恩华
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所计算机科学重点实验室
吴恩华
;
柳有权
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所计算机科学重点实验室
柳有权
.
计算机辅助设计与图形学学报,
2004,
(05)
:601
-612
[9]
A survey of general-purpose computation on graphics hardware
[J].
Owens, John D.
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Univ Calif Davis, Davis, CA 95616 USA
Owens, John D.
;
Luebke, David
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Luebke, David
;
Govindaraju, Naga
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Govindaraju, Naga
;
Harris, Mark
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Harris, Mark
;
Krueger, Jens
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Krueger, Jens
;
Lefohn, Aaron E.
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Lefohn, Aaron E.
;
Purcell, Timothy J.
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Purcell, Timothy J.
.
COMPUTER GRAPHICS FORUM,
2007,
26
(01)
:80
-113
[10]
Sparse matrix solvers on the GPU[J] . Jeff Bolz,Ian Farmer,Eitan Grinspun,Peter Schr?oder.ACM Transactions on Graphics (TOG) . 2003 (3)
←
1
→
共 10 条
[1]
面向OpenCL模型的DCT并行化
[J].
向阳霞
论文数:
0
引用数:
0
h-index:
0
机构:
装甲兵工程学院信息工程系
向阳霞
;
张惠民
论文数:
0
引用数:
0
h-index:
0
机构:
装甲兵工程学院信息工程系
张惠民
;
王子强
论文数:
0
引用数:
0
h-index:
0
机构:
装甲兵工程学院信息工程系
王子强
.
电脑知识与技术,
2013,
9
(26)
:6007
-6011
[2]
面向OpenCL模型的GPU性能优化
[J].
论文数:
引用数:
h-index:
机构:
陈钢
;
论文数:
引用数:
h-index:
机构:
吴百锋
.
计算机辅助设计与图形学学报,
2011,
(04)
:571
-581
[3]
GPU通用计算平台上的SPH流体模拟
[J].
论文数:
引用数:
h-index:
机构:
温婵娟
;
论文数:
引用数:
h-index:
机构:
欧嘉蔚
;
论文数:
引用数:
h-index:
机构:
贾金原
.
计算机辅助设计与图形学学报,
2010,
(03)
:406
-411
[4]
应用GPU集群加速计算蛋白质分子场
[J].
张繁
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学CAD & CG国家重点实验室
浙江工业大学计算机学院
浙江大学CAD & CG国家重点实验室
张繁
;
王章野
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学CAD & CG国家重点实验室
浙江大学CAD & CG国家重点实验室
王章野
;
论文数:
引用数:
h-index:
机构:
姚建
;
吴韬
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学理学院化学系
浙江大学CAD & CG国家重点实验室
吴韬
;
彭群生
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学CAD & CG国家重点实验室
浙江大学CAD & CG国家重点实验室
彭群生
.
计算机辅助设计与图形学学报,
2010,
(03)
:412
-419
[5]
GPU加速的基于增量式聚类的视频拷贝检测方法
[J].
论文数:
引用数:
h-index:
机构:
任化敏
;
张勇东
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所前瞻研究实验室
中国科学院计算技术研究所前瞻研究实验室
张勇东
;
林守勋
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所前瞻研究实验室
中国科学院计算技术研究所前瞻研究实验室
林守勋
.
计算机辅助设计与图形学学报,
2010,
22
(03)
:449
-456
[6]
GPU加速的生物序列比对
[J].
论文数:
引用数:
h-index:
机构:
林江
;
论文数:
引用数:
h-index:
机构:
唐敏
;
童若锋
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学计算机科学与技术学院
童若锋
.
计算机辅助设计与图形学学报,
2010,
22
(03)
:420
-427
[7]
基于CUDA的DCT快速变换实现方法
[J].
论文数:
引用数:
h-index:
机构:
阮军
;
论文数:
引用数:
h-index:
机构:
韩定定
.
微电子学与计算机,
2009,
26
(08)
:201
-205+210
[8]
基于图形处理器(GPU)的通用计算
[J].
吴恩华
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所计算机科学重点实验室
吴恩华
;
柳有权
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所计算机科学重点实验室
柳有权
.
计算机辅助设计与图形学学报,
2004,
(05)
:601
-612
[9]
A survey of general-purpose computation on graphics hardware
[J].
Owens, John D.
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Univ Calif Davis, Davis, CA 95616 USA
Owens, John D.
;
Luebke, David
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Luebke, David
;
Govindaraju, Naga
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Govindaraju, Naga
;
Harris, Mark
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Harris, Mark
;
Krueger, Jens
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Krueger, Jens
;
Lefohn, Aaron E.
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Lefohn, Aaron E.
;
Purcell, Timothy J.
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Davis, Davis, CA 95616 USA
Purcell, Timothy J.
.
COMPUTER GRAPHICS FORUM,
2007,
26
(01)
:80
-113
[10]
Sparse matrix solvers on the GPU[J] . Jeff Bolz,Ian Farmer,Eitan Grinspun,Peter Schr?oder.ACM Transactions on Graphics (TOG) . 2003 (3)
←
1
→