基于DCT压缩域的图象字符定位

被引:17
作者
黄祥林
沈兰荪
机构
[1] 北京工业大学信号与信息处理研究室
关键词
字符定位; DCT变换; 压缩域处理; 形态滤波;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
为了能够利用图象中所含的文字信息来进行图象的快速高效浏览检查 ,其中 ,快速字符定位是很重要的工作 ,为此设计了一种直接在图象压缩域中进行字符定位的方法 .该方法主要是利用图象中字符纹理所具有的方向性特点 ,首先直接在 DCT域中提取字符的横向、竖向、斜向纹理的方向信息 ,然后根据各自的阈值把字符区域从图象背景中分割出来 .在处理过程中 ,用形态滤波的方法可有效地消除噪音点 .该算法可直接处理 JPEG、MPEG等以 DCT为编码基础的压缩数据 ,仅需少量的解码过程 (Huffm an解码 )即可完成字符定位 ,因此要处理的数据量较少 ,用该算法既提高了处理速度 ,又减少了对计算机资源的需求 .试验结果表明 ,此方法具有较高的准确率
引用
收藏
页码:24 / 28
页数:5
相关论文
共 4 条
[1]  
Discrete cosine transform filtering. Chiptrasert B,Rao K R. Signal Processing . 1990
[2]  
The JPEG still picture compression standard. Wallace G K. Communications of the ACM . 1991
[3]  
Locating text in complex color images. Zhong Y,Karu K,Jain A K. Pattern Recognition . 1995
[4]  
Recognizing characters in scene images. Ohya J,Shio A,Akamastsu S. IEEE Transactions on Pattern Analysis and Machine Intelligence . 1994