结合X-means聚类的自适应随机子空间组合分类算法

被引:5
作者
曹鹏 [1 ,2 ]
李博 [1 ,2 ]
栗伟 [1 ,2 ]
赵大哲 [1 ,2 ]
机构
[1] 东北大学信息科学与工程学院
[2] 医学影像计算教育部重点实验室(东北大学)
基金
中央高校基本科研业务费专项资金资助;
关键词
大规模数据集; X-means聚类; 组合分类; 随机子空间; 支持向量机;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
针对大规模数据的分类准确率低且效率下降的问题,提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法,保持原有数据结构的同时,把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空间组合分类器,提升了基分类器的差异性并自动确定基分类器数量,提升了组合分类器的鲁棒性及分类准确性。该算法在人工和UCI数据集上进行了测试,并与传统单分类和组合分类算法进行了比较。实验结果表明,对于大规模数据集,该方法具有更好的分类精度和健壮性,并提升了整体算法的效率。
引用
收藏
页码:550 / 553
页数:4
相关论文
共 16 条
[1]  
The class imbalance problem:A systematic study. Japkowicz N,Stephen S. Intelligent Data Analysis . 2002
[2]  
Combining diversi-ty and classification accuracy for ensemble selection in random subspaces. Ko A H R,Sabourin R,de Souza Britto A. Proceedings of the International Joint Conference on Neural Networks (IJCNN’’06) . 2006
[3]  
Combining pattern classifiers:methods and algorithms. Kuncheva L I. . 2004
[4]  
Probabilistic Outputs for Support Vector Machines and Comparisons to Regularized Likelihood Methods. Platt J C. Advances in Large Margin Classifiers . 1999
[5]  
Cost-sensi-tive learning methods for imbalanced data. THAI-NGHE N,GANTNER Z,SCHMIDT-THIEME L. Proc of InternationalJoint Conference on Neural Networks . 2010
[6]  
10 Challenging problems in data mining re-search. YANG Q,WU X. International Journal of Information Technology and De-cision Making . 2006
[7]  
Locally application of random subspace withsimple Bayesian classifier. KOTSIANTIS S B. International Journal of Data Min-ing,Modelling and Management . 2009
[8]   针对大规模训练集的支持向量机的学习策略 [J].
李红莲 ;
王春花 ;
袁保宗 ;
朱占辉 .
计算机学报, 2004, (05) :715-719
[9]  
统计学习理论的本质[M]. 清华大学出版社 , (美)VladimirN.Vapnik著, 2000
[10]  
Creating and meas-uring diversity in multiple classifier systems using support vector da-ta description. HAGHIGHI M S,VAHEDIAN A,YAZDI H S. Applied Soft Computing . 2011