基于ODR和BSMOTE结合的不均衡数据SVM分类算法

被引:22
作者
陶新民
童智靖
刘玉
付丹丹
机构
[1] 不详
[2] 哈尔滨工程大学信息与通信工程学院
[3] 不详
基金
中国博士后科学基金;
关键词
不均衡数据; 支持向量机算法; 边界人工少数类过采样算法; 逐级优化递减;
D O I
10.13195/j.cd.2011.10.98.taoxm.014
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对传统的支持向量机(SVM)算法在数据不均衡的情况下分类效果不理想的缺陷,为了提高SVM算法在不均衡数据集下的分类性能,提出一种新型的逐级优化递减欠采样算法.该算法去除样本中大量重叠的冗余和噪声样本,使得在减少数据的同时保留更多的有用信息,并且与边界人工少数类过采样算法相结合实现训练样本数据集的均衡.实验表明,该算法不但能有效提高SVM算法在不均衡数据中少数类的分类性能,而且总体分类性能也有所提高.
引用
收藏
页码:1535 / 1541
页数:7
相关论文
共 8 条
[1]   一种基于核SMOTE的非平衡数据集分类方法 [J].
曾志强 ;
吴群 ;
廖备水 ;
高济 .
电子学报, 2009, 37 (11) :2489-2495
[2]   不平衡样本集中SVM的应用综述 [J].
姚程宽 .
计算机应用与软件, 2008, (09) :1-2+29
[3]   不平衡数据分类的研究现状 [J].
林智勇 ;
郝志峰 ;
杨晓伟 .
计算机应用研究, 2008, (02) :332-336
[4]  
Optimal approximation of linear sys-tems by artificial immune response[J]. GONG Maoguo1, DU Haifeng1,2 & JIAO Licheng1 1. Institute of Intelligent Information Processing and Key Laboratory of Radar Signal Processing, Xidian University, Xi’an 710071, China;2. School of Mechanical Engineering, Xi’an Jiaotong University, Xi’an 710049, China.Science in China(Series F:Information Sciences). 2006(01)
[5]   非平衡数据训练方法概述 [J].
张琦 ;
吴斌 ;
王柏 .
计算机科学, 2005, (10) :181-186
[6]   Classification by ensembles from random partitions of high-dimensional data [J].
Ahn, Hongshik ;
Moon, Hojin ;
Fazzari, Melissa J. ;
Lim, Noha ;
Chen, James J. ;
Kodell, Ralph L. .
COMPUTATIONAL STATISTICS & DATA ANALYSIS, 2007, 51 (12) :6166-6179
[7]   Support Vector Machines for Classification in Nonstandard Situations [J].
Yi Lin ;
Yoonkyung Lee ;
Grace Wahba .
Machine Learning, 2002, 46 :191-202
[8]  
Feature selection for text categorization on imbalanced data .2 ZHENG Z H,WU X Y,SRIHARI R. S IGKDD Explorations . 2004