基于主成份分析的Bagging集成学习方法

被引:8
作者
何鸣
李国正
袁捷
吴耿锋
机构
[1] 上海大学计算机工程与科学学院
关键词
集成学习; 主成份分析; 支持向量机;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
机器学习中数据集的冗余特征会影响学习器的泛化能力,一些流行方法如支持向量机和集成学习也难免于此.研究了利用主成份分析进行特征变换对Bagging集成学习算法的影响,提出一种称为PCA-Bagging的算法,并与其它算法比如单个支持向量机、支持向量机Bagging集成、带有特征变换的单个支持向量机等进行了性能比较.在多个UCI标准数据集上的实验表明PCA-Bagging算法具有更好的性能,这说明即使是泛化能力很强的集成学习方法其学习的数据也需要进行适当的特征变换.
引用
收藏
页码:415 / 418+427 +427
页数:5
相关论文
共 6 条
[1]   支持向量机及其在模式识别中的应用 [J].
刘向东 ;
朱美琳 ;
陈兆乾 ;
陈世福 .
计算机科学, 2003, (06) :113-117
[2]   基于支持向量机的计算机键盘用户身份验真 [J].
刘学军 ;
陈松灿 ;
彭宏京 ;
不详 .
计算机研究与发展 , 2002, (09) :1082-1086
[3]   神经网络集成 [J].
周志华 ;
陈世福 .
计算机学报, 2002, (01) :1-8
[4]   Bagging predictors [J].
Breiman, L .
MACHINE LEARNING, 1996, 24 (02) :123-140
[5]  
支持向量机导论.[M].(英)NelloCristianini;(英)JohnShawe-Taylor著;李国正等译;.电子工业出版社.2004,
[6]  
模式识别方法在化学化工中的应用.[M].陈念贻等著;.科学出版社.2000,