针对不平衡数据集的Bagging改进算法

被引:27
作者
李明方
张化祥
机构
[1] 山东师范大学信息科学与工程学院
关键词
不平衡类; 少类样本合成过采样技术(SMOTE); Bagging算法; 权重; 受试者工作特征曲线(ROC);
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
传统的Bagging分类方法对不平衡数据集进行分类时,虽然能够达到很高的分类精度,但是对其中少数类的分类准确率不高。为提高其对少数类数据的分类精度,利用SMOTE算法对样例集中的少数类样例进行加工,在Bagging算法中根据类值对各个样例的权重进行调整。混淆矩阵和ROC曲线表明改进算法达到了既能保证整体的分类准确率,又能提高少数类分类精度的目的。
引用
收藏
页码:40 / 42
页数:3
相关论文
共 3 条
[1]
不平衡数据集的分类方法研究 [J].
王和勇 ;
樊泓坤 ;
姚正安 ;
李成安 .
计算机应用研究, 2008, (05) :1301-1303+1308
[2]
Actively Searching for an Effective Neural Network Ensemble[J] David W. Opitz;Jude W. Shavlik Connection Science 1996,
[3]
Bagging predictors[J] Leo Breiman Machine Learning 1996,