汉字识别多分类器集成的新方法

被引:9
作者
郭宏
丁晓青
郭繁夏
吴佑寿
机构
[1] 清华大学电子工程系
关键词
多分类器;信息熵;综合识别法;惩罚函数;
D O I
10.16511/j.cnki.qhdxxb.1997.10.024
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
从信息熵的角度分析了多分类器集成的重要性,提出了一种用于汉字识别的多分类器集成的新方法——综合识别法。该方法充分考虑到各分类器的特性,在保证效率的同时,较好地改善了用单个分类器识别低质量文本时误识率较高的不足,使系统误识率下降了74%,拒识率下降了27%。提出了一种基于惩罚函数的确定各分类器拒识门限的方法,该方法既可灵活地确定系统的识别率、误识率,又避免了收集巨量训练样本的工作。
引用
收藏
页码:93 / 96
页数:4
相关论文
empty
未找到相关数据