图像数据的视觉显著性检测技术及其应用

被引：0

作者：

杨俊

机构：

[1] 国防科学技术大学

关键词：

视觉显著性; 选择性注意机制; 注意焦点; 感兴趣区域; 感知组织; 层次控制; 空时注意; 特征集成理论; 图像内容检索; 人造目标检测; 视频事件检测; 视频火焰检测;

D O I：

暂无

年度学位：

2007

学位类型：

博士

导师：

王润生;

摘要：

图像是信息社会的主要数据资源,海量的图像数据给高效智能信息处理带来了挑战。我们注意到,人们关心的内容通常只是整幅图像或整段视频中很小的一部分,因此,有必要直接检测出它们,以获得高效的处理结果。这种处理思想源自于人类视觉的选择性注意机制和感知组织原则。由此,我们需要面对如下问题:如何利用视觉显著性的感知原理?如何描述和区分图像信息中可能存在的多种显著性事件?如何将这些心理学原理有效地引入图像分析进程?如何从静态图像或视频序列中快速检测用户关心的显著区域或事件?本论文围绕其展开了研究。论文第一部分集中讨论了视觉显著性检测的基本处理思想。首先,回顾了认知心理学的相关理论,讨论了视觉显著性和图像内容之间的对应关系,提出了一种基于内容相关度的视觉显著性表述策略,将图像显著事件分为弱相关事件和强相关事件两类;继而,分析了注意与组织的层次协作关系,提出了一种图像显著内容的层次描述与理解框架;接着,提出了一种基于泛化注意的图像视觉显著性检测模型,用以将选择性注意机制融入到整个图像处理过程中。论文第二部分集中研究了面向图像数据的视觉显著性检测方法。首先,提出了一种基于注意的显著区域分割及其特征学习改进算法,用以解决区域图像检索中的显著基元提取与描述问题。其后,研究了遥感图像目标识别的应用问题,(1)提出了一种人造目标检测模型和一种区域分割算法,用以解决人造目标候选区的聚焦问题。该模型是层次化结构感知的,区域分割是水平集演化;(2)构建了一种基于结构编组的人造目标分析框架、线结构基元的提取和编组方法,用以解决人造结构的感知组织问题;(3)提出了一种基于显著基元分类感知与编组的遥感道路检测和提取算法。随后,提出了一种基于空时注意的视频显著事件检测模型,并用于视频火焰事件检测和火焰显著区域的提取。论文最后提出了一种图像数据的视觉显著性检测技术实验系统的设计方法,讨论了其可能的潜在应用和扩展问题。论文中提出的各种模型和方法应用于多种类型的真实图像和视频,获得了预期的试验结果,体现出一定的可行性和适应性。

引用

页数：154

共 67 条

[1]

复杂条件下视频运动目标检测和跟踪 [D].

单勇 .

国防科学技术大学,

2006

[2]

CLAM: Closed-loop attention model for visual search.[J].Frank van der Velde;Marc de Kamps;Gwendid T. van der Voort van der Kleij.Neurocomputing.2004,

[3]

A model of active visual search with object-based attention guiding scan paths.[J].Linda J. Lanyon;Susan L. Denham.Neural Networks.2004, 5

[4]

A feedback model of visual attention [J].

Spratling, MW ;

Johnson, MH .

JOURNAL OF COGNITIVE NEUROSCIENCE, 2004, 16 (02) :219-237

[5]

Real-time visual attention on a massively parallel SIMD architecture [J].

Ouerhani, N ;

Hügli, H .

REAL-TIME IMAGING, 2003, 9 (03) :189-196

[6]

State of the art on automatic road extraction for GIS update: a novel classification [J].

Mena, JB .

PATTERN RECOGNITION LETTERS, 2003, 24 (16) :3037-3058

[7]

Contextual priming for object detection [J].

Torralba, A .

INTERNATIONAL JOURNAL OF COMPUTER VISION, 2003, 53 (02) :169-191

[8]

Perceptually-driven decision theory for interactive realistic rendering [J].

Dumont, R ;

Pellacini, F ;

Ferwerda, JA .

ACM TRANSACTIONS ON GRAPHICS, 2003, 22 (02) :152-181

[9]

Retrieval by classification of images containing large manmade objects using perceptual grouping [J].

Iqbal, Q ;

Aggarwal, JK .

PATTERN RECOGNITION, 2002, 35 (07) :1463-1479

[10]

Automatically building appearance models from image sequences using salient features.[J].K.N. Walker;T.F. Cootes;C.J. Taylor.Image and Vision Computing.2002, 5

← 1 2 3 4 5 6 7 →