基于字符编码与卷积神经网络的汉字识别

被引:6
作者
刘正琼 [1 ]
丁力 [1 ]
凌琳 [2 ]
李学飞 [2 ]
周文霞 [1 ]
机构
[1] 合肥工业大学计算机与信息学院
[2] 合肥工业大学机械工程学院
关键词
汉字识别; 卷积神经网络; 字符编码; 过拟合; 批标准化;
D O I
10.13382/j.jemi.B1901964
中图分类号
TP391.41 []; TP18 [人工智能理论];
学科分类号
080203 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
汉字识别是人工智能与模式识别领域中重要的研究内容,针对现有的研究仍然存在着参数调整难度大、训练样本数少、不能识别所有常用字符等问题,提出了一种基于字符编码与卷积神经网络的汉字识别方法,首先通过查询字库得到所有字符信息,以utf-8编码方式与多种字体编码文件进行编码输出字符图像,再进行多种图像处理后得到数据集,并利用深度卷积神经网络进行训练识别,在网络训练中通过数据扩增、批标准化、RMSProp优化等方式进行优化,同时加入正则化和Dropout防止过拟合。实验结果表明,所提方法对于汉字的识别率达到了98.08%,与Alexnet、LeNet-5相比,使用同一数据集在识别准确率上提高了9.37%、21.14%,实现了一个识别率高、特征提取能力与泛化能力强的神经网络。
引用
收藏
页码:143 / 149
页数:7
相关论文
共 6 条
  • [1] 卷积神经网络的多字体汉字识别
    柴伟佳
    王连明
    [J]. 中国图象图形学报, 2018, (03) : 410 - 417
  • [2] 深度学习在手写汉字识别中的应用综述
    金连文
    钟卓耀
    杨钊
    杨维信
    谢泽澄
    孙俊
    [J]. 自动化学报, 2016, 42 (08) : 1125 - 1141
  • [3] 基于多尺度梯度及深度神经网络的汉字识别
    潘炜深
    金连文
    冯子勇
    [J]. 北京航空航天大学学报, 2015, (04) : 751 - 756
  • [4] DropSample: A new training method to enhance deep convolutional neural networks for large-scale unconstrained handwritten Chinese character recognition[J] . Weixin Yang,Lianwen Jin,Dacheng Tao,Zecheng Xie,Ziyong Feng.Pattern Recognition . 2016
  • [5] Online and offline handwritten Chinese character recognition: Benchmarking on new databases[J] . Cheng-Lin Liu,Fei Yin,Da-Han Wang,Qiu-Feng Wang.Pattern Recognition . 2013 (1)
  • [6] An approach for real-time recognition of online Chinese handwritten sentences
    Wang, Da-Han
    Liu, Cheng-Lin
    Zhou, Xiang-Dong
    [J]. PATTERN RECOGNITION, 2012, 45 (10) : 3661 - 3675