文档图像二值化算法VFCM

被引:6
作者
童立靖
陈侃
付晓玲
段建勇
机构
[1] 北方工业大学多媒体技术研究室
关键词
二值化; 文档图像; 阈值; 最大方差比; 模糊C均值算法;
D O I
10.16208/j.issn1000-7024.2009.13.028
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。
引用
收藏
页码:3216 / 3218+3243 +3243
页数:4
相关论文
共 4 条