大矩阵QR分解的FPGA设计与实现

被引:7
作者
周杰 [1 ]
陈啸洋 [1 ]
赵建勋 [2 ]
窦勇 [1 ]
机构
[1] 分布与并行处理国防科技重点实验室
[2] 装甲兵工程学院
关键词
大规模; QR分解; 阵列处理器; FPGA;
D O I
暂无
中图分类号
TN791 [];
学科分类号
080902 ;
摘要
大规模QR分解在信号处理、图像处理、计算结构力学等领域有着广泛的应用。大规模矩阵QR分解主要在高性能并行机上进行运算,目前还没有基于FPGA平台的加速实现。本文在分析快速Givens Rotation QR分解算法特征的基础上,提出并实现了一种细粒度并行QR分解算法,并在Altera StratixⅡ FPGA平台上实现可扩展QR分解线性阵列处理器。相对于单处理单元,该阵列处理器可取得近似线性加速比,显示了良好的可扩展性。在100 MHz频率下的性能测试结果表明,相对于2.0GHz的Pentium双核通用微处理器,该阵列处理器可取得19倍的加速比。
引用
收藏
页码:34 / 37+48 +48
页数:5
相关论文
共 3 条
[1]   Parallel QR factorization for hybrid message passing/shared memory operation [J].
Dunn, IN ;
Meyer, GGL .
JOURNAL OF THE FRANKLIN INSTITUTE-ENGINEERING AND APPLIED MATHEMATICS, 2001, 338 (05) :601-613
[2]   Fast inversion of matrices arising in image processing [J].
Fischer, B ;
Modersitzki, J .
NUMERICAL ALGORITHMS, 1999, 22 (01) :1-11
[3]  
矩阵计算.[M].[美]G·H·格罗布等 著.大连理工大学出版社.1988,