SMOTE和Biased-SVM相结合的不平衡数据分类方法

被引:18
作者
王和勇 [1 ]
樊泓坤 [2 ]
姚正安 [2 ]
机构
[1] 华南理工大学电子商务学院
[2] 中山大学数学与计算科学学院
关键词
机器学习; 不平衡数据; 数据分类; SMOTE; Biased-SVM;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使用Biased-SVM方法,然后对求出的支持向量使用SMOTE向上采样方法进行采样,最后再使用Biased-SVM方法进行分类。实验结果表明,本文采用的SMOTE和Biased-SVM相结合的方法可提高不平衡数据集分类精度。
引用
收藏
页码:174 / 176
页数:3
相关论文
共 3 条
[1]  
统计模式识别[M]. 电子工业出版社 , (英)AndrewR.Webb著, 2004
[2]  
Learning Classifi- ers from Imbalanced Data Based on Biased Minimax Probability Machine. Huang Kaizhu,Yang Haiqin,King I, et al. Proceedings of the IEEE Computer Society Confer- ence on Computer Vision and Pattern Recognition . 2004
[3]  
Class-boundary Alignment for Imbalanced Dataset Leaming. Wu G,Chang E. The Twentieth International Conference on Machine Leaming(ICML)Workshop on Learning from Imbal- anced Datasets . 2003