集成学习算法研究

被引:0
作者
王丽丽
机构
[1] 广西大学
关键词
集成学习; 选择性集成; 蚁群优化算法; 云模型; 性能云; Boosting; Bagging; Weka;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
集成学习是一种新的机器学习范式,它使用多个学习器来解决同一个问题,能够显著地提高学习系统的泛化能力,因此从20世纪90年代开始,对集成学习的理论和算法的研究成为了机器学习领域的一个热点。现在,集成学习已经成功应用于行星探测、地震波分析、Web信息过滤、生物特征识别、计算机辅助医疗诊断等众多领域。 然而集成学习技术还不成熟,集成学习的研究还存在着大量未解决的问题。从集成学习的实际应用情况来看,也远未达到人们所期待的水平。 本文对集成学习进行了深入地研究,简要介绍了集成学习的概念、构成和作用,分析了集成学习中两大算法族Boosting和Bagging的理论基础,阐述了选择性集成学习的基本思想,讨论了目前集成学习存在的不足,利用群体智能,结合云模型理论,提出相应的解决办法,完成了以下研究工作: 1、针对选择性集成的实现复杂度过高问题,借鉴群体智能方法,提出了基于蚁群优化算法的选择性集成算法ACOSEN,利用高速收敛的智能蚁群来选择差异大且精度高的个体学习器,建立最优的集成模型。在机器学习平台Weka上利用UCI数据库对ACOSEN进行了实验测试,实验结果表明该方法优于Boosting和Bagging方法,在正
引用
收藏
页数:72
共 15 条
[1]
Boosting methods for regression [J].
Duffy, N ;
Helmbold, D .
MACHINE LEARNING, 2002, 47 (2-3) :153-200
[2]
An adaptive version of the boost by majority algorithm [J].
Freund, Y .
MACHINE LEARNING, 2001, 43 (03) :293-318
[3]
BoosTexter: A boosting-based system for text categorization [J].
Schapire, RE ;
Singer, Y .
MACHINE LEARNING, 2000, 39 (2-3) :135-168
[4]
Improved boosting algorithms using confidence-rated predictions [J].
Schapire, RE ;
Singer, Y .
MACHINE LEARNING, 1999, 37 (03) :297-336
[5]
An efficient method to estimate bagging's generalization error [J].
Wolpert, DH ;
Macready, WG .
MACHINE LEARNING, 1999, 35 (01) :41-55
[6]
Bagging predictors [J].
Breiman, L .
MACHINE LEARNING, 1996, 24 (02) :123-140
[7]
THE STRENGTH OF WEAK LEARNABILITY [J].
SCHAPIRE, RE .
MACHINE LEARNING, 1990, 5 (02) :197-227
[8]
基于Bagging的选择性聚类集成 [J].
唐伟 ;
周志华 .
软件学报, 2005, (04) :496-502
[9]
基于云X信息的逆向云新算法 [J].
刘常昱 ;
冯芒 ;
戴晓军 ;
李德毅 .
系统仿真学报, 2004, (11) :2417-2420
[10]
基于聚类算法的选择性神经网络集成 [J].
李国正 ;
杨杰 ;
孔安生 ;
陈念贻 .
复旦学报(自然科学版), 2004, (05) :689-691+695