基于CUDA架构的FFT并行计算研究

被引:14
作者
骆岩红 [1 ,2 ]
万国峰 [2 ]
王建华 [2 ]
机构
[1] 西北民族大学电气工程学院
[2] 兰州大学核科学与技术学院
关键词
FFT; GPU; CUDA;
D O I
10.14016/j.cnki.1001-9227.2014.12.025
中图分类号
TP311.1 [程序设计]; O174.2 [傅里叶分析(经典调和分析)];
学科分类号
070302 [分析化学]; 081205 [计算机软件];
摘要
FFT(快速傅里叶变换)是基于提高DFT(离散傅里叶变换)计算的高效算法,它在众多科学和工程领域都得到了广泛的应用。自FFT算法出现以后,从早期的以降低复杂度到近年以来的大规模并行FFT计算,各种优化算法得到广泛的研究。在并行运算领域中,随着可编程的、并行化GPU的不断推广,特别是通用并行统一计算架构CUDA的出现,极大增强了GPU的计算能力,在编程和优化等方面都有显著地提升。鉴于此,本文在分析FFT算法实现的基础上,研究了一种适合GPU运算的FFT并行计算方法,并通过CUDA架构实现了FFT算法在GPU上的运算。该方法的引入在理论不计算数据传输的情况下,使一维FFT运算时间的复杂度由O(N logN2)可以降到O(N/rlogN2)。通过验证,本文提出的CUDA的并行FFT方法得到较好的加速效果,在精度计算上也符合实际的要求,从而证明了该方法的正确性和有效性。
引用
收藏
页码:25 / 28
页数:4
相关论文
共 8 条
[1]
基于CUDA实现经典功率谱估计 [J].
吴昌昊 ;
龚俊 ;
刘子琪 .
四川兵工学报, 2013, 34 (10) :98-101
[2]
基于DSP并行系统的FFT算法实现 [J].
朱林 ;
王志凌 ;
黄天戍 .
武汉理工大学学报, 2009, 31 (20) :102-104+120
[3]
可变长FFT并行旋转因子高效产生算法及实现 [J].
刘红侠 ;
杨靓 ;
黄巾 ;
黄士坦 .
西安电子科技大学学报, 2009, 36 (03) :541-546
[4]
基于CUDA的矩阵乘法和FFT性能测试 [J].
肖江 ;
胡柯良 ;
邓元勇 .
计算机工程, 2009, 35 (10) :7-10
[5]
基于FPGA的FFT处理器的设计与仿真 [J].
董惠 ;
卫铭斐 ;
江丽 ;
曾俊 .
微电子学与计算机, 2008, (11) :117-120
[6]
一种基于FPGA的超高速32k点FFT处理器 [J].
李伟 ;
孙进平 ;
王俊 ;
李少洪 .
北京航空航天大学学报, 2007, (12) :1440-1443
[7]
并行数据FFT/IFFT处理器的设计 [J].
万红星 ;
陈禾 ;
韩月秋 .
北京理工大学学报, 2006, (04) :338-341
[8]
基于SIMD-BF的并行FFT算法 [J].
刘文辉 .
商丘师范学院学报, 2003, (05) :62-63