基于卷积神经网络的图像分类算法综述

被引:104
作者
杨真真 [1 ,2 ]
匡楠 [3 ]
范露 [3 ]
康彬 [4 ]
机构
[1] 南京邮电大学通信与网络技术国家工程研究中心
[2] 南京邮电大学理学院
[3] 南京邮电大学通信与信息工程学院
[4] 南京邮电大学物联网学院
基金
中国博士后科学基金;
关键词
卷积神经网络; 图像分类; 深度学习; 生成式对抗网络; 胶囊网络;
D O I
10.16798/j.issn.1003-0530.2018.12.009
中图分类号
TP391.41 []; TP183 [人工神经网络与计算];
学科分类号
080203 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
随着大数据的到来以及计算能力的提高,深度学习(Deep Learning,DL)席卷全球。传统的图像分类方法难以处理庞大的图像数据以及无法满足人们对图像分类精度和速度上的要求,基于卷积神经网络(Convolutional Neural Network,CNN)的图像分类方法冲破了传统图像分类方法的瓶颈,成为目前图像分类的主流算法,如何有效利用卷积神经网络来进行图像分类成为国内外计算机视觉领域研究的热点。本文在对卷积神经网络进行系统的研究并且深入研究卷积神经网络在图像处理中的应用后,给出了基于卷积神经网络的图像分类所采用的主流结构模型、优缺点、时间/空间复杂度、模型训练过程中可能遇到的问题和相应的解决方案,与此同时也对基于深度学习的图像分类拓展模型的生成式对抗网络和胶囊网络进行介绍;然后通过仿真实验验证了在图像分类精度上,基于卷积神经网络的图像分类方法优于传统图像分类方法,同时综合比较了目前较为流行的卷积神经网络模型之间的性能差异并进一步验证了各种模型的优缺点;最后对于过拟合问题、数据集构建方法、生成式对抗网络及胶囊网络性能进行相关实验及分析。
引用
收藏
页码:1474 / 1489
页数:16
相关论文
共 9 条
[1]   ReLU激活函数优化研究 [J].
蒋昂波 ;
王维维 .
传感器与微系统, 2018, 37 (02) :50-52
[2]  
Covariance structure regularization via entropy loss function[J] . Lijing Lin,Nicholas J. Higham,Jianxin Pan.Computational Statistics and Data Analysis . 2014
[3]  
Learning the Classifier Combination for Image Classification[J] . Deyuan Zhang,Bingquan Liu,Chengjie Sun,Xiaolong Wang.Journal of Computers . 2011 (8)
[4]   Face recognition using Histograms of Oriented Gradients [J].
Deniz, O. ;
Bueno, G. ;
Salido, J. ;
De la Torre, F. .
PATTERN RECOGNITION LETTERS, 2011, 32 (12) :1598-1603
[5]  
Subject independent facial expression recognition with robust face detection using a convolutional neural network[J] . Masakazu Matsugu,Katsuhiko Mori,Yusuke Mitari,Yuji Kaneda.Neural Networks . 2003 (5)
[6]  
An improved face recognition technique based on modular PCA approach[J] . Rajkiran Gottumukkal,Vijayan K. Asari.Pattern Recognition Letters . 2003 (4)
[7]  
Map-image matching using a multi-layer perceptron: the case of the road network[J] . ISPRS Journal of Photogrammetry and Remote Sensing . 1998 (2)
[8]  
Dynamic Routing Between Capsules .2 Sara Sabour,Nicholas Frosst,Geoffrey E.Hinton. Neural Information Processing Systems (NIPS) . 2017
[9]  
CIFAR10-DVS:An Event-Stream Dataset for Object Classification .2 Li H,Liu H,Ji X,et al. Frontiers in Neuroscience . 2017