基于Stacking算法的组合分类器及其应用于中文组块分析

被引:18
作者
李珩
朱靖波
姚天顺
机构
[1] 东北大学计算机软件与理论研究所
关键词
叠加式; 多分类器; 文本组块;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
与基于Voting方法的组合分类器相比,提出基于Stacking算法的多分类器组合方法,通过构造一个两层的叠加式框架结构,将4种分类器(fnTBL,SNoW,SVM,MBL)进行了组合,并融合各种可能的上下文信息作为各层分类器的输入特征向量,在中文组块识别中取得了较好的效果.实验结果表明,组合后的分类器无论在准确率还是召回率上都有所提高,在哈尔滨工业大学树库语料的测试下达到了F=93.64的结果.
引用
收藏
页码:844 / 848
页数:5
相关论文
共 2 条
[1]  
BoosTexter: A Boosting-based System for Text Categorization[J] . Robert E. Schapire,Yoram Singer.Machine Learning . 2000 (2-3)
[2]   Bagging predictors [J].
Breiman, L .
MACHINE LEARNING, 1996, 24 (02) :123-140