学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于距离加权的自适应字线分离算法
被引:2
作者
:
李艳霞
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
李艳霞
孙羽菲
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
孙羽菲
张玉志
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张玉志
机构
:
[1]
中国科学院计算技术研究所
来源
:
计算机工程
|
2007年
/ 04期
关键词
:
文档分析和识别;
表格识别;
字线分离;
OCR;
D O I
:
暂无
中图分类号
:
TP391.43 [];
学科分类号
:
0811 ;
081101 ;
081104 ;
1405 ;
摘要
:
提出一种基于距离加权的自适应字线分离算法。应用一定的启发式规则,计算表格线上像素点的权值,将权值与阈值相比较来判断该点是否为字符上的点,其中权值和阈值根据具体表格自动确定。该算法与表格线检测方法无关,且易于实现。实验结果表明,可以很好地处理字线交叠问题,提高了表格识别的正确率。
引用
收藏
页码:206 / 208
页数:3
相关论文
共 3 条
[1]
票据图像中的格线检测与去除
[J].
张重阳
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
张重阳
;
娄震
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
娄震
;
徐勇
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
徐勇
;
杨静宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
杨静宇
.
计算机工程与设计,
2005,
(07)
:1778
-1780
[2]
一种表格框线检测和字线分离算法
[J].
刘长松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
刘长松
;
潘世言
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
潘世言
;
郑冶枫
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
郑冶枫
;
丁晓青
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
丁晓青
.
电子与信息学报,
2002,
(09)
:1190
-1196
[3]
A generic system for form dropout .2 YU Bin,JAIN A K. IEEE Tran-sactions on Pattern Analysis and Machine Intelligence . 1996
←
1
→
共 3 条
[1]
票据图像中的格线检测与去除
[J].
张重阳
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
张重阳
;
娄震
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
娄震
;
徐勇
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
徐勇
;
杨静宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
杨静宇
.
计算机工程与设计,
2005,
(07)
:1778
-1780
[2]
一种表格框线检测和字线分离算法
[J].
刘长松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
刘长松
;
潘世言
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
潘世言
;
郑冶枫
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
郑冶枫
;
丁晓青
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
丁晓青
.
电子与信息学报,
2002,
(09)
:1190
-1196
[3]
A generic system for form dropout .2 YU Bin,JAIN A K. IEEE Tran-sactions on Pattern Analysis and Machine Intelligence . 1996
←
1
→