基于卷积神经网络的自然场景中数字识别

被引:15
作者
周成伟
机构
[1] 南京邮电大学计算机学院
关键词
卷积神经网络; 自然场景; 数字识别; 端到端;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TP391.41 [];
学科分类号
080203 ;
摘要
从复杂的图片背景中提取文本信息一直是计算机视觉中的热点与难点问题。近年来,随着卷积神经网络在图像识别研究的突破性进展,传统的人工提取图像特征方式逐渐为深层网络学习特征方式所取代,而应用卷积神经网络(CNN)的场景文本识别方法也越来越受到广泛的关注。为此,提出了自然场景下基于卷积网络结构的数字识别改进方法。该方法能够对目标区域进行检测,并进行端到端的数字字符识别训练,数字识别部分提取的特征还可用来初始化目标检测的网络部分,以减少特征的重复提取并提高训练速度。需要处理的图像输入无需固定格式,只需输入原始图像即可,可减少图像预处理过程及其对原始图像数据的不良影响,提高图像识别的精度。基于谷歌街景数据集(SVHN)与MSRA-TD500、ICDAR 2013数据集的数字字符识别验证结果表明,该方法的识别效果优于其他已有的识别方法。
引用
收藏
页码:101 / 105
页数:5
相关论文
共 12 条
  • [1] 深度学习在手写汉字识别中的应用综述
    金连文
    钟卓耀
    杨钊
    杨维信
    谢泽澄
    孙俊
    [J]. 自动化学报, 2016, 42 (08) : 1125 - 1141
  • [2] 基于深度学习的人脸姿态分类方法
    邓宗平
    赵启军
    陈虎
    [J]. 计算机技术与发展, 2016, 26 (07) : 11 - 13+18
  • [3] 手写数字深度特征学习与识别
    陈浩翔
    蔡建明
    刘铿然
    林秋爽
    张文玲
    周涛
    [J]. 计算机技术与发展, 2016, 26 (07) : 19 - 23+29
  • [4] 神经网络七十年:回顾与展望
    焦李成
    杨淑媛
    刘芳
    王士刚
    冯志玺
    [J]. 计算机学报, 2016, 39 (08) : 1697 - 1716
  • [5] CNN视觉特征的图像检索
    李钊
    卢苇
    邢薇薇
    孙占全
    王伟东
    魏云超
    [J]. 北京邮电大学学报, 2015, 38(S1) (S1) : 103 - 106+120
  • [6] 图像物体分类与检测算法综述
    黄凯奇
    任伟强
    谭铁牛
    [J]. 计算机学报, 2014, 37 (06) : 1225 - 1240
  • [7] 深度学习研究进展
    刘建伟
    刘媛
    罗雄麟
    [J]. 计算机应用研究, 2014, 31 (07) : 1921 - 1930+1942
  • [8] 深度学习的昨天、今天和明天
    余凯
    贾磊
    陈雨强
    徐伟
    [J]. 计算机研究与发展, 2013, 50 (09) : 1799 - 1804
  • [9] 基于深度学习的自然场景文字识别[D]. 黄攀.浙江大学. 2016
  • [10] Robust wide-baseline stereo from maximally stable extremal regions
    Matas, J
    Chum, O
    Urban, M
    Pajdla, T
    [J]. IMAGE AND VISION COMPUTING, 2004, 22 (10) : 761 - 767