印刷体英文文档识别系统的设计与实现

被引:9
作者
尹芳
王卫兵
陈德运
机构
[1] 哈尔滨理工大学计算机科学与技术学院
关键词
英文文档识别; 特征提取; 特征组合;
D O I
10.15938/j.jhust.2008.06.025
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
光学字符识别是模式识别领域的一个重要分支.提出并实现了一种用于印刷体英文文档的OCR系统.该系统使用基于字符识别的方法进行文档识别,图像经过预处理后,提取多种特征进行组合,并且考虑到字符粘连的情况,在训练样本中加入部分易粘连字母组合进行识别.通过实验证明,该识别系统快速、稳定且有效.
引用
收藏
页码:9 / 12
页数:4
相关论文
共 5 条
[1]   基于组合特征的手写体数字识别方法 [J].
夏国恩 ;
金炜东 ;
张葛祥 .
计算机应用研究, 2006, (06) :170-172
[2]   一种基于词片识别的字符分割算法 [J].
岳思聪 ;
王庆 ;
赵荣椿 .
中国图象图形学报, 2006, (01) :8-12
[3]   一种组合特征抽取的新方法 [J].
杨健 ;
杨静宇 ;
王正群 ;
郭丽 .
计算机学报, 2002, (06) :570-575
[4]   鲁棒的多体印刷英文识别系统的实现 [J].
伍振军 ;
丁晓青 .
计算机工程与应用, 2001, (20) :120-122
[5]   MACHINE PRINTED CHARACTER SEGMENTATION - AN OVERVIEW [J].
LU, Y .
PATTERN RECOGNITION, 1995, 28 (01) :67-80