高效率的K-means最佳聚类数确定算法

被引:61
作者
王勇
唐靖
饶勤菲
袁巢燕
机构
[1] 重庆理工大学计算机科学与工程学院
关键词
K-means聚类; 数据分层; 聚类有效性指标; 相似性程度; 最佳聚类数;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
针对K-means聚类算法通常无法事先设定聚类数,而人为设定初始聚类数目容易导致聚类结果不够稳定的问题,提出一种新的高效率的K-means最佳聚类数确定算法。该算法通过样本数据分层来得到聚类数搜索范围的上界,并设计了一种聚类有效性指标来评价聚类后类内与类间的相似性程度,从而在聚类数搜索范围内获得最佳聚类数。仿真实验结果表明,该算法能够快速、高效地获得最佳聚类数,对数据集聚类效果良好。
引用
收藏
页码:1331 / 1335
页数:5
相关论文
共 9 条
  • [1] KBAC:一种基于K-means的自适应聚类
    徐晓旻
    肖仰华
    [J]. 小型微型计算机系统, 2012, 33 (10) : 2268 - 2272
  • [2] K-means聚类算法优化方法的研究
    于海涛
    李梓
    姚念民
    [J]. 小型微型计算机系统, 2012, 33 (10) : 2273 - 2277
  • [3] 一种基于密度的K-means算法研究
    张琳
    陈燕
    汲业
    张金松
    [J]. 计算机应用研究, 2011, 28 (11) : 4071 - 4073+4085
  • [4] 新的K-均值算法最佳聚类数确定方法
    周世兵
    徐振源
    唐旭清
    [J]. 计算机工程与应用, 2010, 46 (16) : 27 - 31
  • [5] 简单有效的确定聚类数目算法
    张忠平
    王爱杰
    柴旭光
    [J]. 计算机工程与应用 , 2009, (15) : 166 - 168
  • [6] 聚类算法研究
    孙吉贵
    刘杰
    赵连宇
    [J]. 软件学报, 2008, (01) : 48 - 61
  • [7] 基于免疫规划的K-means聚类算法
    行小帅
    潘进
    焦李成
    [J]. 计算机学报, 2003, (05) : 605 - 610
  • [8] An examination of indexes for determining the number of clusters in binary data sets
    Dimitriadou, E
    Dolnicar, S
    Weingessel, A
    [J]. PSYCHOMETRIKA, 2002, 67 (01) : 137 - 159
  • [9] A dendrite method for cluster analysis.[J].T. Calinski;J. Harabasz.Communications in Statistics - Theory and Methods.1974, 1