表格自动录入系统的研究

被引:7
作者
李星原,洪家荣,陈彬
机构
[1] 哈尔滨工业大学计算机科学与工程系
关键词
OCR,文本分析,机器学习,数学形态学;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
本文论述一个表格自动录入系统.它包括表格分析与理解和字符识别.文中提出了表格分析与理解的一个层次模型和算法.它用数学形态学检测表格线段.然后形成表格线段描述.再从表格线段产生表格线.从表格线产生矩形块集合.最后进行表格理解和结果生成.它具有抗部分断线、虚线和倾斜的能力。不受粘连和噪音点的影响。文中还提出一种基于机器学习的字符识别方法。通过对大量样本的学习来产生分类的规则。并介绍了一个基于此方法的手写数字识别系统。该系统对学习样本识别率为100%。对测试样本的识别率达到97.6%。
引用
收藏
页码:924 / 929
页数:6
相关论文
empty
未找到相关数据