基于GPGPU的并行影像匹配算法

被引:44
作者
肖汉 [1 ,2 ]
张祖勋 [1 ]
机构
[1] 武汉大学遥感信息工程学院
[2] 郑州师范高等专科学校
关键词
细粒度并行计算; 图形处理器的通用计算; 统一计算设备架构; 影像匹配; 单指令多线程;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实验结果表明,并行算法充分利用GPU的并行处理能力,在处理1280×1024分辨率的8位灰度图像时可达到最高多处理器warp占有率,速度是基于CPU实现的7倍。CUDA在高运算强度数据处理中呈现出的实时处理能力和计算能力,为进一步加速影像匹配性能和GPU通用计算提供了新的方法和思路。
引用
收藏
页码:46 / 51
页数:6
相关论文
共 5 条
  • [1] 基于集群系统的并行图像灰度匹配
    宗亮
    邬延辉
    [J]. 宁波大学学报(理工版), 2009, 22 (01) : 74 - 77
  • [2] A survey of general-purpose computation on graphics hardware
    Owens, John D.
    Luebke, David
    Govindaraju, Naga
    Harris, Mark
    Krueger, Jens
    Lefohn, Aaron E.
    Purcell, Timothy J.
    [J]. COMPUTER GRAPHICS FORUM, 2007, 26 (01) : 80 - 113
  • [3] CUDA2.0for WI NDOWS CUDA2.0Program-ming Guide. NVIDI A. http:∥developer.download.nvidia.com/compute/cuda/20/docs/NVIDI ACUDAProgrammingGuide2.0.pdf . 2008
  • [4] CUDA2.0for WI NDOWS CUDA2.0Reference Manual. NVIDI A. http:∥developer.down-load.nvidia.com/compute/cuda/20/docs/CudaReference-Manual2.0.pdf . 2008
  • [5] High Performance Direct Gravitational N-body Simulations on Graphics Processing Units -Ⅱ:An implementation in CUDA. Robert G.Belleman,Jeroen Bdorf,Simon F.Portegies Zwart. New Astronomy . 2008