一种表格框线检测和字线分离算法

被引:11
作者
刘长松
潘世言
郑冶枫
丁晓青
机构
[1] 清华大学电子工程系智能技术与系统国家重点实验室
[2] 清华大学电子工程系智能技术与系统国家重点实验室 北京
[3] 北京
关键词
表格识别; 图像分析; 直线检测; 字符识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出了一种基于有向单连通链的表格框线检测算法,能够合理地利用单连通链边沿的全局统计特性和单连通链之间的局部位置关系,精确地提取表格框线,具有抗倾斜,抗断裂,抗字线交叠等优点。在此基础上,提出了一种能够分离交叠字线的表格框线去除算法,并成功应用于实际的表格识别系统中。
引用
收藏
页码:1190 / 1196
页数:7
相关论文
共 1 条
[1]  
From Raster to Vectors: Extracting Visual Information from Line Drawings[J] . Liu Wenyin,Dov Dori.Pattern Analysis & Applications . 1999 (1)