一种层次初始的聚类个数自适应的聚类方法研究

被引:5
作者
魏建东
陆建峰
彭甫镕
机构
[1] 南京理工大学计算机科学与工程学院
关键词
K均值算法; 层次初始化; 戴维森堡丁指数; 初始聚类中心; 聚类个数;
D O I
10.14022/j.cnki.dzsjgc.2015.06.002
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
K均值聚类算法是一种常见且有效的基于划分的聚类算法。为解决该聚类算法对初始中心敏感的问题,常用的方法是层次化初始聚类中心。然而,层次初始的聚类算法仍然需要将聚类个数作为输入参数,在高维数据和海量数据中不易应用。基于能够自动确定聚类数目的目的,采用DBI度量,提出一种层次初始的聚类个数自适应的聚类方法(简称DHIKM)。通过UCI数据集和仿真数据上的实验,证明DHIKM可以在采样数据中快速找到合适的聚类个数,实验结果表明该算法在聚类质量与收敛速度上的有效性。
引用
收藏
页码:5 / 8
页数:4
相关论文
共 3 条
[1]   一种基于几何关系的多分类器差异性度量及其在多分类器系统构造中的应用 [J].
梁绍一 ;
韩德强 ;
韩崇昭 .
自动化学报, 2014, 40 (03) :449-458
[2]  
知识发现[M]. 清华大学出版社 , 史忠植著, 2002
[3]   Hierarchical initialization approach for K-Means clustering [J].
Lu, J. F. ;
Tang, J. B. ;
Tang, Z. M. ;
Yang, J. Y. .
PATTERN RECOGNITION LETTERS, 2008, 29 (06) :787-795