基于图模型的图像分析研究

被引:0
作者
朱士蓉
机构
[1] 合肥工业大学
关键词
有向图模型; Dirichlet过程; 目标识别; 上下文信息; 场景分析;
D O I
暂无
年度学位
2011
学位类型
硕士
摘要
目标识别、场景分析是图像理解的重要内容。如何构建一种通用有效的反馈的框架,适用于多类别目标场景图像分析,是计算机视觉领域的研究难点。本文以图像中有何种目标、目标间的关系、图像是什么场景为研究方向,主要包括两方面:一是场景中的目标识别,二是场景图像分析。目标识别具有主动性,是为了对场景进行更好的解释,是场景分析的基础;场景分析为目标识别提供先验信息,可以指导目标识别;二者相互关联、约束。本文主要工作如下: 1)分析了图结构模型的类别及其各自特性,介绍了有向图和概率论如何运用于贝叶斯框架下的生成模型中,并描述了图模型下的三种Dirichlet分布及其概率采样方法。 2)实现了层次Dirichlet过程下的场景图像单目标识别和转换Dirichlet过程下的场景图像多目标识别。前者根据分层思想将场景图像看做“目标-部分-区域”,分别计算上层标记所对应的下层数据的概率分布,根据概率确定标记。在此基础上后者进一步融入目标的空间位置转换信息,根据目标类别位置信息的概率分布情况,可在场景图像的不同位置生成多个目标实例,从而实现多目标类别及实例的识别。 3)研究了有向图模型下分层次的、融入上下文知识的场景分析。采用场景级的全局上下文信息为目标识别提供先验信息,采用目标级的局部上下文信息对多目标识别加以约束,目标识别结果可以反馈作用于场景分析,形成一个反馈的过程。
引用
收藏
页数:69
共 15 条
[1]
图像理解理论与方法.[M].高隽; 谢昭; 著.科学出版社.2009,
[2]
视觉心理学.[M].[英]格列高里(Gregory;R·L·) 著;彭聃龄;杨栚 译.北京师范大学出版社.1986,
[3]
Hierarchical Dirichlet processes [J].
Teh, Yee Whye ;
Jordan, Michael I. ;
Beal, Matthew J. ;
Blei, David M. .
JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 2006, 101 (476) :1566-1581
[4]
Which is the best way to organize/classify images by content?.[J]..Image and Vision Computing.2006, 6
[5]
A comparison of affine region detectors [J].
Mikolajczyk, K ;
Tuytelaars, T ;
Schmid, C ;
Zisserman, A ;
Matas, J ;
Schaffalitzky, F ;
Kadir, T ;
van Gool, L .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2005, 65 (1-2) :43-72
[6]
Distinctive image features from scale-invariant keypoints [J].
Lowe, DG .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (02) :91-110
[7]
Scale & affine invariant interest point detectors [J].
Mikolajczyk, K ;
Schmid, C .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (01) :63-86
[8]
Statistical modeling and conceptualization of natural images.[J].Jianping Fan;Yuli Gao;Hangzai Luo;Guangyou Xu.Pattern Recognition.2004, 6
[9]
An introduction to MCMC for machine learning [J].
Andrieu, C ;
de Freitas, N ;
Doucet, A ;
Jordan, MI .
MACHINE LEARNING, 2003, 50 (1-2) :5-43
[10]
Modeling the shape of the scene: A holistic representation of the spatial envelope [J].
Oliva, A ;
Torralba, A .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2001, 42 (03) :145-175