多字体印刷藏文字符识别

被引:16
作者
王华
丁晓青
机构
[1] 清华大学电子工程系
关键词
人工智能; 模式识别; 藏文字符识别; 方向线素特征; 线性鉴别分析; 带偏差欧氏距离; 修正二次鉴别函数;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
藏文字符识别系统是中文多文种信息处理系统的重要组成部分 ,但至今国内外的研究基本处于空白。本文提出了一种基于统计模式识别的多字体印刷藏文字符识别方法 :从字符轮廓中抽取方向线素特征 ,利用线性鉴别分析 (LDA)压缩降维后得到紧凑的字符特征向量。采用基于置信度分析的两级分类策略 ,设计了带偏差欧氏距离分类器 (EDD)完成高效的粗分类 ,细分类采用修正二次鉴别函数 (MQDF)。通过实验选取恰当的分类器参数后 ,在容量为 177,6 0 0字符 (30 0样本 /字符类 )的测试集上的识别率达到 99.79% ,证明了该方法的有效性
引用
收藏
页码:47 / 52
页数:6
相关论文
共 2 条
[1]   藏文基本字符识别算法研究 [J].
王维兰 .
西北民族学院学报(自然科学版), 1999, (03) :20-23+51
[2]   基于模糊方向线素特征的手写体汉字识别 [J].
马少平 ;
夏莹 ;
朱小燕 .
清华大学学报(自然科学版), 1997, (03) :43-46