基于全信息矩阵的多分类器集成方法

被引:17
作者
唐春生
金以慧
机构
[1] 清华大学自动化系
[2] 清华大学自动化系 北京
关键词
多分类器组合; 全信息矩阵; 文本分类;
D O I
10.13328/j.cnki.jos.2003.06.011
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
自动文本分类是提高信息利用效率和质量的有效方法,而多分类器的有效组合能够得到更高的分类准确率.给出了样本集在多分类器下的全信息矩阵概念,并提出一种权重自适应调整的多分类器集成方法.该方法能够自适应地选择分类器组合及确定分类器权重,并利用分类统计信息指导分类结果的集成判决.通过在标准文本集Reuters-21578上的实验表明:该方法能从查准率和查全率两方面提高文本分类的整体性能,同时表明了该方法的有效性.
引用
收藏
页码:1103 / 1109
页数:7
相关论文
共 3 条
[1]   基于相关性和有效互补性分析的多分类器组合方法 [J].
荆晓远 ;
杨静宇 .
自动化学报, 2000, (06) :741-747
[2]   一种识别手写汉字的多分类器集成方法 [J].
肖旭红 ;
戴汝为 .
自动化学报, 1997, (05) :47-53
[3]  
A metasynthetic approach for handwrittenChinese character recognition .2 XiaoXH,DaiRW. ActaAutomaticaSinica . 1997