深度学习在图像语义分类中的应用

被引:0
作者
杜骞
机构
[1] 华中师范大学
关键词
图像语义; 图像分类; 深度学习; 图像特征;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
图像分类问题长久以来都是学术界研究的热点问题,也是图像检索、图像理解和分析等研究的基础。近年来随着网络上数字图像的增长,传统的图像分类方法已经不能满足现实应用的需要,基于语义的图像分类方法越来越受到关注。本文通过分析生物视觉、图像特征等方面的最新研究成果,提出了层次化语义特征必须具备的一些特点,根据深度学习模型学习数据的层次化特征的原理,提出使用深度学习模型学习图像的层次化语义特征,并在此基础上设计了两种深度学习模型来进行图像的语义分类。 本文主要研究了以下几个方面: (1)介绍了图像语义分类的意义和常见思路,讨论了两类构造图像语义特征的方法,分析了这两类方法的缺点,介绍了深度学习的发展历程,并对本文的主要工作做了简要的介绍。 (2)对人类视觉皮层,特别是和一般视觉特征处理相关的视觉子区域,做了比较详细而深入的介绍。对常见的四类构造图像特征的思路做了详细介绍,分析了每种思路的优缺点。在前面两项工作的基础上,总结了图像语义特征必须具备的特点,提出了使用层次化学习模型来学习图像中的特征。 (3)对分布式表示做了介绍,从表示能力角度说明了层次化表示的必要性。对常见的深度学习模型的理论和学习过程做了简要的介绍。 (4)对图像语义分类问题作出了自己的定义。结合图像语义分类的实际问题,提出使用栈式去噪自动编码器和卷积深度玻尔兹曼机来提取图像的语义特征,然后进行图像分类。针对深度学习模型难优化的问题,总结了深度学习模型优化的常见技巧。 (5)在CIFAR-10和STL-10数据集上验证了本文提出的两种深度学习模型在图像语义分类任务上的效果。对分类结果做了分析,对本文的工作做了总结和展望。
引用
收藏
页数:69
共 11 条
[1]
基于GaborSIFT+NNScSPM图像特征抽取算法研究 [J].
江爱文 ;
王春恒 ;
肖柏华 .
自动化学报, 2011, 37 (10) :1183-1189
[2]
融合LDA和多类SVM的图像语义映射研究 [J].
赵炜 ;
陈俊杰 ;
李海芳 .
计算机工程与应用 , 2009, (18) :164-166
[3]
图像语义特征的抽取方法及其应用 [J].
石跃祥 ;
朱东辉 ;
蔡自兴 ;
BBenhabib .
计算机工程, 2007, (19) :177-179
[4]
视觉感知模型与编码算法研究 [D]. 
杨文璐 .
上海交通大学,
2008
[5]
视觉感知的稀疏编码理论及其应用研究 [D]. 
李清勇 .
中国科学院研究生院(计算技术研究所),
2006
[6]
A Sparse Object Coding Scheme in Area V4 [J].
Carlson, Eric T. ;
Rasquinha, Russell J. ;
Zhang, Kechen ;
Connor, Charles E. .
CURRENT BIOLOGY, 2011, 21 (04) :288-293
[7]
Specialized color modules in macaque extrastriate cortex [J].
Conway, Bevil R. ;
Moeller, Sebastian ;
Tsao, Doris Y. .
NEURON, 2007, 56 (03) :560-573
[8]
Modeling the shape of the scene: A holistic representation of the spatial envelope [J].
Oliva, A ;
Torralba, A .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2001, 42 (03) :145-175
[9]
A saliency-based search mechanism for overt and covert shifts of visual attention.[J].Laurent Itti;Christof Koch.Vision Research.2000, 10
[10]
Sparse coding with an overcomplete basis set: A strategy employed by V1? [J].
Olshausen, BA ;
Field, DJ .
VISION RESEARCH, 1997, 37 (23) :3311-3325