基于距离加权的自适应字线分离算法

被引:2
作者
李艳霞
孙羽菲
张玉志
机构
[1] 中国科学院计算技术研究所
关键词
文档分析和识别; 表格识别; 字线分离; OCR;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
提出一种基于距离加权的自适应字线分离算法。应用一定的启发式规则,计算表格线上像素点的权值,将权值与阈值相比较来判断该点是否为字符上的点,其中权值和阈值根据具体表格自动确定。该算法与表格线检测方法无关,且易于实现。实验结果表明,可以很好地处理字线交叠问题,提高了表格识别的正确率。
引用
收藏
页码:206 / 208
页数:3
相关论文
共 3 条
[1]   票据图像中的格线检测与去除 [J].
张重阳 ;
娄震 ;
徐勇 ;
杨静宇 .
计算机工程与设计, 2005, (07) :1778-1780
[2]   一种表格框线检测和字线分离算法 [J].
刘长松 ;
潘世言 ;
郑冶枫 ;
丁晓青 .
电子与信息学报, 2002, (09) :1190-1196
[3]  
A generic system for form dropout .2 YU Bin,JAIN A K. IEEE Tran-sactions on Pattern Analysis and Machine Intelligence . 1996