一种用于非平衡数据分类的集成学习模型

被引:5
作者
焦盛岚
杨炳儒
翟云
赵万里
机构
[1] 北京科技大学计算机与通信工程学院
关键词
非平衡数据; 集成学习模型; 基本分类器; 改进的支持向量机-K最近邻(SVM-KNN); UCI数据集;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对非平衡数据分类问题,提出了一种改进的SVM-KNN分类算法,在此基础上设计了一种集成学习模型。该模型采用限数采样方法对多数类样本进行分割,将分割后的多数类子簇与少数类样本重新组合,利用改进的SVM-KNN分别训练,得到多个基本分类器,对各个基本分类器进行组合。采用该模型对UCI数据集进行实验,结果显示该模型对于非平衡数据分类有较好的效果。
引用
收藏
页码:119 / 123+219 +219
页数:6
相关论文
共 8 条
[1]   不平衡类数据挖掘研究综述 [J].
翟云 ;
杨炳儒 ;
曲武 .
计算机科学, 2010, 37 (10) :27-32
[2]   一种基于核SMOTE的非平衡数据集分类方法 [J].
曾志强 ;
吴群 ;
廖备水 ;
高济 .
电子学报, 2009, 37 (11) :2489-2495
[3]   SVM-KNN分类器在网页分类中的应用 [J].
李蓉 ;
孙媛 .
科学技术与工程, 2009, 9 (16) :4653-4656
[4]   非平衡数据集分类问题研究进展 [J].
高嘉伟 ;
梁吉业 .
计算机科学, 2008, (04) :10-13
[5]   SVM-KNN组合改进算法在专利文本分类中的应用 [J].
李程雄 ;
丁月华 ;
文贵华 .
计算机工程与应用, 2006, (20) :193-195+212
[6]   SVM-KNN分类器——一种提高SVM分类精度的新方法 [J].
李蓉 ;
叶世伟 ;
史忠植 .
电子学报, 2002, (05) :745-748
[7]   Cost-sensitive boosting for classification of imbalanced data [J].
Sun, Yamnin ;
Kamel, Mohamed S. ;
Wong, Andrew K. C. ;
Wang, Yang .
PATTERN RECOGNITION, 2007, 40 (12) :3358-3378
[8]  
Unbalanced data classification using extreme outlier elimination and sampling techniques for fraud detection .2 T. M. Padmaja,N. Dhulipalla,R. S. Bapi,P. R. Krishna. International Conference on Machine Learning and Cybernetics on Advanced Computing and Communications . 2007