基于多特征融合的东亚文种识别

被引:11
作者
王刚 [1 ]
靳彦青 [2 ]
刘立柱 [1 ]
储瑞来 [3 ]
机构
[1] 解放军信息工程大学
[2] 国家数字交换系统工程技术研究中心
[3] 南京理工大学
关键词
文种识别; 多特征; 字符复杂度特征; 贴近度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对目前基于统计特征和符号匹配的识别方法对字体较敏感的问题,提出一种基于多特征融合的东亚文种识别算法。该算法首先分析并提取高频形状特征、排版特征以及字符复杂度特征,然后采用模糊集贴近度准则进行识别。实验结果表明,该算法具有较高的识别准确率,并对不同字体具有较强的鲁棒性。
引用
收藏
页码:273 / 276
页数:4
相关论文
共 5 条
[1]
一种具有旋转鲁棒性的文本图像文种识别方法 [J].
顾立娟 ;
平西建 ;
程娟 ;
郝玉保 .
中国图象图形学报 , 2010, (06) :879-886
[2]
基于模糊集隶属度特征和贴近度的徽标识别 [J].
王刚 ;
靳彦青 ;
刘立柱 .
计算机科学, 2009, 36 (01) :184-185+193
[3]
基于二元树复数小波变换的文种自动识别 [J].
朱华光 ;
平西建 ;
程娟 .
数据采集与处理, 2008, 23 (06) :766-771
[4]
基于多尺度小波纹理分析的文字种类自动识别 [J].
曾理 ;
唐远炎 ;
陈廷槐 .
计算机学报, 2000, (07) :699-704
[5]
Identification of different script lines from multi-script documents.[J].U Pal;B.B Chaudhuri.Image and Vision Computing.2002, 13