基于深度学习的图像分类方法研究

被引:0
作者
孟丹
机构
[1] 华东师范大学
关键词
深度学习; 卷积神经网; 特征表达; 图像分类;
D O I
暂无
年度学位
2017
学位类型
博士
摘要
图像分类是模式识别、机器学习和人工智能的重要基础,图像分类一般包括感兴趣区域选取、特征提取以及分类器建模三个步骤,其中,图像的特征提取是完成其他任务的重要基础。而在多数模式识别场景下,合适的特征表达是其中的关键环节,直接影响着整个分类系统的性能。其中,最具代表性的是直接从海量数据中学习复杂特征表达的深度学习方法。虽然深度学习在图像分类中已经取得了很好的效果,但之前的工作依然存在一些难题:1)在保证性能的前提下,如何简化深度学习的网络结构和参数?2)在小样本数据集情况下,如何进行深度学习?为了解决这些问题,本文在深度学习框架的基础上对特征提取方法进行了研究,并通过医学图像、人脸表情的检测和分类对其效果进行了验证。本文的研究内容主要包括以下三点:1)提出有约束的高分散主成分分析网络(Constrained High Dispersal PCANet,CHDNet)。本文详细分析了 CHDNet的不同组件对分类性能的影响,针对PCANet的局限性,设计了非线性变化层、多尺度特征池化层,以提高分类性能。将CHDNet应用在医学图像分类中,包括基于Kinect深度图像的人体生理机能自动检测和计算机辅助舌象诊断,取得良好效果。并通过加权的LIBLINEARSVM验证了在正负样本分布严重不均衡的情况下,CHDNet可以学习到稳定的特征表达。2)提出局部线性嵌入网络(Locally Linear Embedding Network,LLENet)。提出利用图像重构集和类内-类间判别矩阵对LLE算法进行改进,并将基于LLE算法的改进嵌入到卷积核的学习、构建过程中,增加了不同类之间特征表达的区分度。LLENet能够更好地保持图像数据原有的流形结构,并在人脸表情数据库(JAFFE和CK+)和人脸识别数据库(Extended Yale B)上,通过实验证明了 LLENet算法的有效性。实验结果表明,LLENet学习的特征表达不仅优于经典的人工设计的特征提取方法,而且比同类的CNN、PCANet深度学习特征提取方法更加有效。3)研究小样本数据集下基于迁移学习和全连接神经网络(Fully Connected Net-work,FCNet)的深度学习方法。分析了将深度卷积神经网络 CNN 模型迁移到小样本数据的方法,通过热度图展示了不同类别的特征,并构建用于分类的全连接分类器FCNet,特征提取和分类可以分段进行,实现了超声图像中的肝纤维化分类,达到93.90%的准确率。综上所述,本文主要研究了基于局部特征卷积核的神经网络:CHDNet和LLENet,以及在应对小样本数据集时的处理方法。通过实验,本文验证了上述算法的有效性及实际应用价值。
引用
收藏
页数:144
共 27 条
[1]
基于深度置信网集成的高光谱数据分类方法研究 [D]. 
赵兴 .
哈尔滨工业大学,
2015
[2]
Boosted NNE collections for multicultural facial expression recognition.[J].Ghulam Ali;Muhammad Amjad Iqbal;Tae-Sun Choi.Pattern Recognition.2016,
[3]
A spatio-temporal RBM-based model for facial expression recognition.[J].S. Elaiwat;M. Bennamoun;F. Boussaid.Pattern Recognition.2016,
[4]
Face image classification by pooling raw features.[J].Fumin Shen;Chunhua Shen;Xiang Zhou;Yang Yang;Heng Tao Shen.Pattern Recognition.2016,
[5]
A comparison of 3D interest point descriptors with application to airport baggage object detection in complex CT imagery [J].
Flitton, Greg ;
Breckon, Toby P. ;
Megherbi, Najla .
PATTERN RECOGNITION, 2013, 46 (09) :2420-2436
[6]
LIBSVM.[J].Chih-Chung Chang;Chih-Jen Lin.ACM Transactions on Intelligent Systems and Technology (TIST).2011, 3
[7]
Facial expression recognition based on Local Binary Patterns: A comprehensive study.[J].Caifeng Shan;Shaogang Gong;Peter W. McOwan.Image and Vision Computing.2008, 6
[8]
A fast learning algorithm for deep belief nets [J].
Hinton, Geoffrey E. ;
Osindero, Simon ;
Teh, Yee-Whye .
NEURAL COMPUTATION, 2006, 18 (07) :1527-1554
[9]
Framewise phoneme classification with bidirectional LSTM and other neural network architectures.[J].Alex Graves;Jürgen Schmidhuber.Neural Networks.2005, 5
[10]
Distinctive image features from scale-invariant keypoints [J].
Lowe, DG .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (02) :91-110