K-means聚类算法研究综述

被引:261
作者
王千 [1 ]
王成 [2 ]
冯振元 [1 ]
叶金凤 [3 ]
机构
[1] 部队
[2] 西安交通大学航天航空学院
[3] 中国建设银行苏州常熟支行
关键词
K-means聚类算法; NP难优化问题; 数据子集的数目K; 初始聚类中心选取; 相似性度量和距离矩阵;
D O I
10.14022/j.cnki.dzsjgc.2012.07.034
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。
引用
收藏
页码:21 / 24
页数:4
相关论文
共 3 条
[1]   NP-hardness of Euclidean sum-of-squares clustering [J].
Aloise, Daniel ;
Deshpande, Amit ;
Hansen, Pierre ;
Popat, Preyas .
MACHINE LEARNING, 2009, 75 (02) :245-248
[2]  
Analysis of Global k-Means, an Incremental Heuristic for Minimum Sum-of-Squares Clustering[J] . Pierre Hansen,Eric Ngai,Bernard K. Cheung,Nenad Mladenovic.Journal of Classification . 2005 (2)
[3]   An empirical comparison of four initialization methods for the K-Means algorithm [J].
Peña, JM ;
Lozano, JA ;
Larrañaga, P .
PATTERN RECOGNITION LETTERS, 1999, 20 (10) :1027-1040