不平衡数据的集成分类算法综述

被引:190
作者
李勇 [1 ,2 ]
刘战东 [1 ]
张海军 [1 ]
机构
[1] 新疆师范大学网络信息安全与舆情分析重点实验室
[2] 南京航空航天大学计算机科学与技术学院
关键词
不平衡数据; 集成学习; 分类; 代价敏感; 数据采样;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
140502 [人工智能];
摘要
集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。
引用
收藏
页码:1287 / 1291
页数:5
相关论文
共 19 条
[1]
EUSBoost: Enhancing ensembles for highly imbalanced data-sets by evolutionary undersampling.[J].Mikel Galar;Alberto Fernández;Edurne Barrenechea;Francisco Herrera.Pattern Recognition.2013,
[2]
Analysis of preprocessing vs. cost-sensitive learning for imbalanced classification. Open problems on intrinsic data characteristics.[J].Victoria López;Alberto Fernández;Jose G. Moreno-Torres;Francisco Herrera.Expert Systems With Applications.2011, 7
[3]
Top 10 algorithms in data mining.[J].Xindong Wu;Vipin Kumar;J. Ross Quinlan;Joydeep Ghosh;Qiang Yang;Hiroshi Motoda;Geoffrey J. McLachlan;Angus Ng;Bing Liu;Philip S. Yu;Zhi-Hua Zhou;Michael Steinbach;David J. Hand;Dan Steinberg.Knowledge and Information Systems.2009, 1
[4]
Cost-sensitive boosting for classification of imbalanced data [J].
Sun, Yamnin ;
Kamel, Mohamed S. ;
Wong, Andrew K. C. ;
Wang, Yang .
PATTERN RECOGNITION, 2007, 40 (12) :3358-3378
[5]
An introduction to ROC analysis [J].
Fawcett, Tom .
PATTERN RECOGNITION LETTERS, 2006, 27 (08) :861-874
[6]
Class imbalances versus small disjuncts.[J].Taeho Jo;Nathalie Japkowicz.ACM SIGKDD Explorations Newsletter.2004, 1
[7]
Learning from imbalanced data sets with boosting and data generation.[J].Hongyu Guo;Herna L. Viktor.ACM SIGKDD Explorations Newsletter.2004, 1
[8]
New applications of ensembles of classifiers [J].
Barandela, R ;
Sánchez, JS ;
Valdovinos, RM .
PATTERN ANALYSIS AND APPLICATIONS, 2003, 6 (03) :245-256
[9]
A decision-theoretic generalization of on-line learning and an application to boosting [J].
Freund, Y ;
Schapire, RE .
JOURNAL OF COMPUTER AND SYSTEM SCIENCES, 1997, 55 (01) :119-139
[10]
Bagging predictors [J].
Breiman, L .
MACHINE LEARNING, 1996, 24 (02) :123-140