K-means聚类算法中聚类个数的方法研究

被引:17
作者
刘飞
唐雅娟
刘瑶
机构
[1] 汕头大学电子工程系
关键词
K-means算法; 聚类个数; 初始聚类中心; 数据挖掘; K-means算法改进;
D O I
10.14022/j.cnki.dzsjgc.2017.15.003
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在数据挖掘算法中,K均值聚类算法是一种比较常见的无监督学习方法,簇间数据对象越相异,簇内数据对象越相似,说明该聚类效果越好。然而,簇个数的选取通常是由有经验的用户预先进行设定的参数。本文提出了一种能够自动确定聚类个数,采用SSE和簇的个数进行度量,提出了一种聚类个数自适应的聚类方法(简称:SKKM)。通过UCI数据和仿真数据对象的实验,对SKKM算法进行了验证,实验结果表明改进的算法可以快速的找到数据对象中聚类个数,提高了算法的性能。
引用
收藏
页码:9 / 13
页数:5
相关论文
共 11 条
[1]   一种改进K-means算法的聚类算法CARDBK [J].
朱烨行 ;
李艳玲 ;
崔梦天 ;
杨献文 .
计算机科学, 2015, 42 (03) :201-205
[2]   移动终端百度地图偏移修正方法的研究 [J].
潘盛辉 ;
张硕望 .
信息通信, 2014, (10) :40-41
[3]   基于用户特性的Web会话模式聚类算法 [J].
郑富兰 ;
吴瑞 .
计算机应用与软件, 2014, 31 (02) :283-286
[4]   Optimization of constitutive parameters of foundation soils k-means clustering analysis [J].
Muge Elif Orakoglu ;
Cevdet Emin Ekinci .
Sciences in Cold and Arid Regions, 2013, 5 (05) :626-636
[5]   K-Means算法的研究与改进 [J].
周爱武 ;
陈宝楼 ;
王琰 .
计算机技术与发展, 2012, 22 (10) :101-104
[6]  
An accelerated K-means clustering algorithm using selection and erasure rules[J]. Suiang-Shyan LEE,Ja-Chen LIN.Journal of Zhejiang University-Science C(Computers & Electronics). 2012(10)
[7]   数据挖掘中聚类算法研究进展 [J].
周涛 ;
陆惠玲 .
计算机工程与应用, 2012, 48 (12) :100-111
[8]   K-means聚类算法研究综述 [J].
王千 ;
王成 ;
冯振元 ;
叶金凤 .
电子设计工程, 2012, 20 (07) :21-24
[9]   基于划分和层次的混合动态聚类算法 [J].
郝洪星 ;
朱玉全 ;
陈耿 ;
李米娜 .
计算机应用研究, 2011, 28 (01) :51-53
[10]   Cluster center initialization algorithm for K-modes clustering [J].
Khan, Shehroz S. ;
Ahmad, Amir .
EXPERT SYSTEMS WITH APPLICATIONS, 2013, 40 (18) :7444-7456