学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
汉字识别多分类器集成的新方法
被引:9
作者
:
论文数:
引用数:
h-index:
机构:
郭宏
丁晓青
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
丁晓青
论文数:
引用数:
h-index:
机构:
郭繁夏
吴佑寿
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
吴佑寿
机构
:
[1]
清华大学电子工程系
来源
:
清华大学学报(自然科学版)
|
1997年
/ 10期
关键词
:
多分类器;信息熵;综合识别法;惩罚函数;
D O I
:
10.16511/j.cnki.qhdxxb.1997.10.024
中图分类号
:
TP391.41 [];
学科分类号
:
080203 ;
摘要
:
从信息熵的角度分析了多分类器集成的重要性,提出了一种用于汉字识别的多分类器集成的新方法——综合识别法。该方法充分考虑到各分类器的特性,在保证效率的同时,较好地改善了用单个分类器识别低质量文本时误识率较高的不足,使系统误识率下降了74%,拒识率下降了27%。提出了一种基于惩罚函数的确定各分类器拒识门限的方法,该方法既可灵活地确定系统的识别率、误识率,又避免了收集巨量训练样本的工作。
引用
收藏
页码:93 / 96
页数:4
相关论文
未找到相关数据
未找到相关数据