不均衡数据集中基于Adaboost的过抽样算法

被引:13
作者
韩慧 [1 ]
王文渊 [1 ]
毛炳寰 [2 ]
机构
[1] 清华大学自动化系
[2] 中央财经大学统计系
关键词
不均衡数据集; 过抽样; 提升算法;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
为了提高不均衡数据集中少数类的分类性能,该文融合了提升和过抽样的优点,提出了基于提升算法Adaboost的过抽样算法MCMO-Boost,并且将其与决策树算法C4.5、提升算法Adaboost和过抽样算法SMOTE进行了实验比较与分析。结果表明,MCMO-Boost算法在少数类和数据集的总体分类性能方面都优于其它算法。
引用
收藏
页码:207 / 209
页数:3
相关论文
共 1 条
[1]   Improved boosting algorithms using confidence-rated predictions [J].
Schapire, RE ;
Singer, Y .
MACHINE LEARNING, 1999, 37 (03) :297-336