基于视觉感知的影像质量评价方法研究

被引:0
作者
路文
机构
[1] 西安电子科技大学
关键词
影像质量评价; 人类视觉系统; 多尺度几何分析; 图像模型; 视频数据库; 轮廓波;
D O I
暂无
年度学位
2009
学位类型
博士
导师
摘要
影像质量评价旨在寻找精确的计算模型来预测影像视觉质量的变化。影像是利用各种观测系统以不同形式刻画客观世界而获得的视觉实体。它相对于文字和图形所承载的信息更真切、更丰富,正所谓“百闻不如一见”。由于影像数据在采集、压缩、处理、传输和恢复的过程中可能会引入各种失真,这些失真会对后续的影像处理、分析和理解带来困难,不利于人们正确的认识客观世界。因此,需要通过度量影像的视觉失真程度,来设计方法和优化系统,以最少的代价提供最好的视觉质量。 本文针对影像质量评价的基本问题,探索人类视觉系统和数字信息之间的联系,在图像稀疏表示和特征建模的基础上,为影像处理中由未知因素造成的各种失真构建客观评价方法,以度量影像的失真程度和提供信息的能力,从而为视觉质量评价提供合理依据。主要工作概括如下: (1)针对人类视觉系统的生理学和心理学特性,结合基于仿生学的误差可见度模型,从图像的基本结构和几何特征出发,利用原始图像和待测图像的结构差异和几何相似来度量视觉质量的变化。提出了基于人类视觉系统的全参考型图像质量评价测度。实验结果表明,本方法不仅与视觉感知有较好的一致性,而且算法复杂度很低,取得了预期的效果。 (2)在图像特征提取和稀疏表示的基础上,模拟人类视觉系统的多通道特性,采用多尺度几何分析来获取图像的几何特征。然后利用人类视觉心理物理学的对比敏感度和掩模特性,对图像的几何特征进行感知滤波,进而利用该特征来捕捉由于失真而引起的视觉感知的变化。提出了基于多尺度几何分析的部分参考型图像质量评价测度框架。实验结果表明,利用该框架的各种方法所得到的客观评价结果与主观观测值之间具有很好的一致性,能准确地反映人眼对图像质量的主观感受。 (3)在自然图像统计特性的基础上,利用计算模型来构建图像特征的一般分布规律,采用轮廓波来刻画图像尺度间、尺度内、和方向间的统计相关性,然后对自然图像模型在轮廓波变换域尺度间的变化进行分析,并结合图像模型的变化来捕获不同程度的失真,最后使用这些变化特征的非线性映射来表征图像质量。提出了基于轮廓波变换域的无参考型图像质量评价测度。该算法适用于不同的图像失真类型,且与视觉感知的一致性较好。 (4)针对不同失真类型的特点,根据视觉感知与失真过程的密切关系,从人眼对影像的敏感性和敏锐性出发,结合影像的整体结构和内容的局部结构进行分析,利用影像的结构相似性来度量视觉失真的变化。提出了基于失真模型优化的视频质量评价方法。在VQEG视频数据库上进行测试,获得了较好的评价性能。 (5)深入分析了VQEG视频数据库的优缺点,针对该数据库存在的局限性和网络流媒体发展的紧迫性,结合目前主流视频压缩标准H.264,对大量的内容丰富的视频序列进行各种不同量化尺度以及码率的压缩,并邀请一定数量的非专业人士,利用主观排序方法和自动评分平台对压缩产生的失真序列进行主观打分。完成了面向编码失真的视频质量评价数据库的构建,为视频质量评价研究的深入进行夯实了基础。 上述研究成果是在实际应用中抽象出的科学问题,涉及到影像处理的基础理论,是从新的角度、基于新的条件和应用进行研究的,富有一定的前瞻性和挑战性,具有极其重要的理论意义和应用价值。本论文在理论上有一些突破,技术上有一定创新,为影像质量评价的发展开辟了新的思路,提供了一些有意义的参考。
引用
收藏
页数:162
共 18 条
[1]
Wavelet-based contourlet in quality evaluation of digital images.[J].Xinbo Gao;Wen Lu;Xuelong Li;Dacheng Tao.Neurocomputing.2008, 1
[2]
Supervised tensor learning [J].
Dacheng Tao ;
Xuelong Li ;
Xindong Wu ;
Weiming Hu ;
Stephen J. Maybank .
KNOWLEDGE AND INFORMATION SYSTEMS, 2007, 13 (01) :1-42
[3]
PVQM – A perceptual video quality measure.[J].A.P. Hekstra;J.G. Beerends;D. Ledermann;F.E. de Caluwe;S. Kohler;R.H. Koenen;S. Rihs;M. Ehrsam;D. Schlauss.Signal Processing: Image Communication.2002, 10
[4]
NATURAL IMAGE STATISTICS AND NEURAL REPRESENTATION.[J].Eero P Simoncelli;Bruno A Olshausen.Annual Review of Neuroscience.2001, 1
[5]
A neural network model for the development of simple and complex cell receptive fields within cortical maps of orientation and ocular dominance 1 Technical Report CAS/CNS-TR-96-021. 1.[J].Steven J. Olson;Stephen Grossberg.Neural Networks.1998, 2
[6]
A survey of hybrid MC/DPCM/DCT video coding distortions [J].
Yuen, M ;
Wu, HR .
SIGNAL PROCESSING, 1998, 70 (03) :247-278
[7]
A neural model of contour integration in the primary visual cortex [J].
Li, ZP .
NEURAL COMPUTATION, 1998, 10 (04) :903-940
[8]
Modelling the spatio-temporal modulation response of ganglion cells with difference-of-Gaussians receptive fields: Relation to photoreceptor response kinetics [J].
Donner, K ;
Hemila, S .
VISUAL NEUROSCIENCE, 1996, 13 (01) :173-186
[9]
A SELF-SIMILAR STACK MODEL FOR HUMAN AND MACHINE VISION [J].
BURTON, GJ ;
HAIG, ND ;
MOORHEAD, IR .
BIOLOGICAL CYBERNETICS, 1986, 53 (06) :397-403
[10]
Video Quality Research Home Page...http://www.its.bldrdoc.gov/vqeg.,