基于CUDA的并行全搜索运动估计算法

被引:52
作者
甘新标
沈立
王志英
机构
[1] 国防科学技术大学计算机学院
关键词
图形处理器; 运动估计; 并行; CUDA;
D O I
暂无
中图分类号
TN919.81 [图像编码];
学科分类号
083905 [应用与数据安全及新兴信息技术安全];
摘要
为了提高H.264视频编码效率,基于计算统一设备架构(CUDA)的并行全搜索运动估计算法,并利用GPU强大的计算能力和CUDA优化的存储层次结构,以加速H.264编码中的运动估计.与传统的以牺牲视频质量来提升运动估计性能的方法不同,该算法在保证视频质量的同时,结合运动估计计算密集、计算量大等特点,充分利用CUDA架构的并行性加快运动估计的速度,从而达到提高实时编码速度的目的.在GTX280实验平台上的实验结果显示,采用文中算法比优化的CPU实现可获得高达70倍的加速比.
引用
收藏
页码:457 / 460
页数:4
相关论文
共 4 条
[1]
基于GPGPU的Lattice-Boltzmann数值模拟算法 [J].
周季夫 ;
钟诚文 ;
尹世群 ;
解建飞 ;
张勇 .
计算机辅助设计与图形学学报, 2008, (07) :912-918
[2]
基于图形处理器的数据流快速聚类 [J].
曹锋 ;
周傲英 .
软件学报, 2007, (02) :291-302
[3]
基于图形处理器(GPU)的通用计算 [J].
吴恩华 ;
柳有权 .
计算机辅助设计与图形学学报, 2004, (05) :601-612
[4]
Survey on block matching motion estimation algorithms and architectures with new results [J].
Huang, YW ;
Chen, CY ;
Tsai, CH ;
Shen, CF ;
Chen, LG .
JOURNAL OF VLSI SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY, 2006, 42 (03) :297-320