一种优化初始中心的K-means聚类算法

被引:21
作者
邓海
覃华
孙欣
机构
[1] 广西大学计算机与电子信息学院
关键词
K-means聚类; 聚类中心; 高密度点; 垂直中心点;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对传统K-means聚类算法对初始聚类中心的敏感性和随机性,造成容易陷入局部最优解和聚类结果波动性大的问题,结合密度法和最大化最小距离的思想,提出基于最近高密度点间的垂直中心点优化初始聚类中心的K-means聚类算法。该算法选取相互间距离最大的K对高密度点,并以这K对高密度点的均值作为聚类的初始中心,再进行Kmeans聚类。实验结果表明,该算法有效排除样本中含有的孤立点,并且聚类过程收敛速度快,聚类结果有更好的准确性和稳定性。
引用
收藏
页码:42 / 45
页数:4
相关论文
共 5 条
[1]   K均值聚类算法初始质心选择的改进 [J].
孙可 ;
刘杰 ;
王学颖 .
沈阳师范大学学报(自然科学版), 2009, (04) :448-450
[2]   一种改进的K-means算法 [J].
张玉芳 ;
毛嘉莉 ;
熊忠阳 .
计算机应用, 2003, (08) :31-33+60
[3]   A method for initialising the K-means clustering algorithm using kd-trees [J].
Redmond, Stephen J. ;
Heneghan, Conor .
PATTERN RECOGNITION LETTERS, 2007, 28 (08) :965-973
[4]   Cluster center initialization algorithm for K-means clustering [J].
Khan, SS ;
Ahmad, A .
PATTERN RECOGNITION LETTERS, 2004, 25 (11) :1293-1302
[5]  
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)