一种基于核SMOTE的非平衡数据集分类方法

被引:49
作者
曾志强 [1 ,2 ]
吴群 [2 ]
廖备水 [2 ]
高济 [2 ]
机构
[1] 厦门理工学院计算机科学与技术系
[2] 浙江大学计算机科学与技术学院
关键词
非平衡数据集; 支持向量机; 输入空间; 特征空间; 原像;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果.
引用
收藏
页码:2489 / 2495
页数:7
相关论文
共 2 条
[1]   一种基于混合策略的失衡数据集分类方法 [J].
李鹏 ;
王晓龙 ;
刘远超 ;
王宝勋 .
电子学报, 2007, (11) :2161-2165
[2]  
Applying Support Vector Machines to Imbalanced Datasets .2 Akbani R,Kwek S,Japkowicz N. Proceedings of 15thEuropean Conf on Machine Learning (ECML) . 2004