基于多尺度梯度及深度神经网络的汉字识别

被引:23
作者
潘炜深
金连文
冯子勇
机构
[1] 华南理工大学电子与信息学院
基金
广东省科技计划;
关键词
多尺度滑动窗; 梯度直方图; 深度神经网络; 泛化能力; 汉字识别;
D O I
10.13700/j.bh.1001-5965.2014.0499
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
介绍了一种基于多尺度滑动窗的方法提取文字的梯度直方图特征,并结合深度神经网络对印刷体汉字进行识别.针对梯度直方图的空间关系,使用可伸缩的滑动窗对图像进行分割,在不同尺度上获取文字的特征信息,有效融合汉字的全局特征和局部分块特征.实验采用5层的深度神经网络模型对国标一级3 755个印刷体汉字进行分类,并应用Dropout技术防止训练过拟合,提高神经网络的泛化能力.实验准确率达到98.292%,有较好的识别性能,验证了本文多尺度梯度特征及深度神经网络模型在文字识别上的有效性.
引用
收藏
页码:751 / 756
页数:6
相关论文
共 4 条
  • [1] 光学字符识别技术与展望
    荆涛
    王仲
    [J]. 计算机工程, 2003, (02) : 1 - 2+80
  • [2] 汉字识别研究的回顾
    丁晓青
    [J]. 电子学报, 2002, (09) : 1364 - 1368
  • [3] A comparative study of texture measures with classification based on featured distributions[J] . Pattern Recognition . 1996 (1)
  • [4] Improving deep neural networks for LVCSR using rectified linear units and dropout .2 Dahl G E,Sainath T N,Hinton G E. IEEE International Conference on Acoustics,Speech and Signal Processing . 2013