Kmeans聚类分析算法中一个新的确定聚类个数有效性的指标

被引:23
作者
李双虎
王铁洪
机构
[1] 河北省科学院应用数学研究所
[2] 河北省科学院自动化研究所
关键词
聚类分析; Kmeans算法; 有效性度量; 指标;
D O I
10.16191/j.cnki.hbkx.2003.04.003
中图分类号
O151.21 [矩阵论];
学科分类号
摘要
K means算法是聚类分析中使用最为广泛的算法之一。然而,该算法通常受到初始聚类条件的影响。关于这个问题的详细讨论可参看文献[1]。该算法的另一个不足之处是,聚类数目K必须作为参数由用户提供。笔者提出了一个新的有关聚类有效性的度量指标和优化的K means算法。它能自动确定最佳聚类个数。
引用
收藏
页码:199 / 202
页数:4
相关论文
共 5 条
[1]  
AnEmpiricalComparisonoffourInitializationMethodsfortheK MeansAlgorithm. PenaJM,J.A Lozano,P.Larranaga. PatternRecognitionLetters . 1999
[2]  
InitializationofIterativeRefinementClusteringAlgorithms. UsamaM Fayyad,CoryA.Reina,PaulS.Bradley. Proc.4thInternationalConf.OnKnowledgeDiscovery&DataMining . 1998
[3]  
OnClusterValidityfortheFuzzyc MeansModel. PalNR,J.C Bezdek. IEEETransactionsonFuzzySystems . 1995
[4]  
Reiber, A New Cluster Validity Index for Fuzzy c-Means. Rezaee M R,B P F Lelieveldt and J. H. C. Pattern Recognition . 1998
[5]  
DeterminationofNumberofClustersinK MeansClusteringandApplicationinColourImageSegmentation. RayS,RHTuri. ICAPRDT’’99 . 1999