基于深度信念卷积神经网络的图像识别与分类

被引:20
作者
刘琼 [1 ]
李宗贤 [2 ]
孙富春 [3 ]
田永鸿 [2 ]
曾炜 [2 ]
机构
[1] 北京信息科技大学自动化学院
[2] 北京大学信息科学技术学院数字视频编解码技术国家工程实验室
[3] 清华大学计算机科学与技术系智能技术与系统国家重点实验室
关键词
深度信念网络; 图像识别; 卷积神经网络;
D O I
10.16511/j.cnki.qhdxxb.2018.22.034
中图分类号
TP391.41 []; TP183 [人工神经网络与计算];
学科分类号
080203 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对基于卷积神经网络的图像识别采用随机初始化网络权值的方法易收敛到局部最优值的问题,该文提出了一种结合无监督和有监督学习的网络权值预训练算法。融合零成分分析白化与深度信念网络预学习得到的特征,对卷积神经网络权值进行初始化;通过卷积、池化等操作,对训练样本进行特征提取并使用全连接网络对特征进行分类;计算分类损失函数并优化网络参数。在公开图像数据库中进行了大量实验,与公开最佳算法比较,该算法在MNIST中的识别错误率降低了0.1%,在Caltech101中的分类准确率提升了0.56%,验证了该算法优于现有算法。
引用
收藏
页码:781 / 787
页数:7
相关论文
共 6 条
[1]  
Multi-column deep neural network for traffic sign classification[J] . Neural Networks . 2012
[2]  
Man vs. computer: Benchmarking machine learning algorithms for traffic sign recognition[J] . J. Stallkamp,M. Schlipsing,J. Salmen,C. Igel.Neural Networks . 2012
[3]  
Learning multiple layers of representation[J] . Geoffrey E. Hinton.Trends in Cognitive Sciences . 2007 (10)
[4]  
A quantitative theory of immediate visual recognition[J] . Thomas Serre,Gabriel Kreiman,Minjoon Kouh,Charles Cadieu,Ulf Knoblich,Tomaso Poggio.Progress in Brain Research . 2007
[5]   FEATURE-EXTRACTION FROM FACES USING DEFORMABLE TEMPLATES [J].
YUILLE, AL ;
HALLINAN, PW ;
COHEN, DS .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 1992, 8 (02) :99-111
[6]  
Image Net Classification with Deep Convolutional Neural Networks. Krizhevsky A,Sutskever I,Hinton GE. Proceedings of the 25th International Conference on Neural Information Processing . 2012