基于半监督K-Means的属性加权聚类算法

被引:6
作者
潘巍
周晓英
吴立锋
王国辉
机构
[1] 首都师范大学信息工程学院
[2] 首都师范大学北京市高可靠嵌入式系统工程研究中心
[3] 首都师范大学北京市电子系统可靠性技术研究重点实验室
关键词
均值; 聚类; 半监督; 主成分分析; 属性加权;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
K-Means是经典的非监督聚类算法,因其速度快,稳定性高广泛应用在各个领域。但传统的K-Means没有考虑无关属性以及噪声属性的影响,并且不能自动寻找聚类数目K。而目前K-Means的改进算法中,也鲜有关于高维以及噪声方面的改进。因此,结合PCA提出基于半监督的K-Means加权属性聚类方法。首先,用PCA得到更少更有效的特征,并计算它们的分类贡献率(即每个特征对聚类的影响因子)。其次,由半监督自适应算法得到K。最后将加权数据集以及K应用到聚类中。实验表明,该算法具有更好的识别率和普适性。
引用
收藏
页码:189 / 193+242 +242
页数:6
相关论文
共 8 条
[1]   一种层次初始的聚类个数自适应的聚类方法研究 [J].
魏建东 ;
陆建峰 ;
彭甫镕 .
电子设计工程, 2015, (06) :5-8
[2]  
k-MM:A Hybrid Clustering Algorithm Based on k-means and k-Medoids. Drias H,Cherif N F,Kechid A. Advances in Nature and Biologically Inspired Computing . 2016
[3]  
On Careful Selection of Initial Centers for K-means Algorithm. Jothi R,Mohanty S K,Ojha A. Proceedings of 3rd International Conference on Advanced Computing,Networking and Informatics . 2016
[4]  
Mux-Kmeans:multiplex kmeans for clustering large-scale data set. Li C,Zhang Y,Jiao M,et al. Proceedings of the5th ACM workshop on Scientific cloud computing . 2014
[5]  
A data mining correlated patterns-based periodic decentralized replication strategy for data grids[J] . Tarek Hamrouni,Sarra Slimani,Faouzi Ben Charrada. &nbspThe Journal of Systems & Software . 2015
[6]   基于近邻传播算法的最佳聚类数确定方法比较研究 [J].
周世兵 ;
徐振源 ;
唐旭清 .
计算机科学, 2011, 38 (02) :225-228
[7]   K均值聚类算法在银行客户细分中的研究 [J].
樊宁 .
计算机仿真, 2011, 28 (03) :369-372
[8]   一种基于特征间隙的检测簇数的谱聚类算法 [J].
胡海峰 ;
刘萍萍 .
计算机技术与发展, 2015, 25 (09) :37-42