聚类有效性研究综述

被引:285
作者
周开乐 [1 ,2 ]
杨善林 [1 ,2 ]
丁帅 [1 ,2 ]
罗贺 [1 ,2 ]
机构
[1] 合肥工业大学管理学院
[2] 过程优化与智能决策教育部重点实验室
基金
国家高技术研究发展计划(863计划);
关键词
聚类; 聚类有效性; 聚类有效性指标; 最佳聚类数;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
聚类是一个无监督学习过程,因此确定最佳聚类数是一项困难的工作.聚类有效性研究是通过建立聚类有效性指标,评价聚类质量并确定最佳聚类数的过程.首先,介绍了聚类的数学描述和聚类有效性指标的分类;然后,基于指标构成成分的不同,分别评述了12个仅考虑数据集几何结构信息的聚类有效性指标、6个仅考虑隶属度的聚类有效性指标以及9个同时考虑数据集几何结构信息和隶属度的聚类有效性指标,分析了不同类型指标的研究现状;接着,简要总结了外部性指标和稳定性指标等其他聚类有效性指标的研究现状;最后,总结并展望了聚类有效性研究面临的挑战和发展方向.
引用
收藏
页码:2417 / 2431
页数:15
相关论文
共 27 条
[1]
Business Intelligence and Analytics: From Big Data to Big Impact.[J]..MIS Quarterly.2012, 4
[2]
Determining the number of clusters using information entropy for mixed data.[J].Jiye Liang;Xingwang Zhao;Deyu Li;Fuyuan Cao;Chuangyin Dang.Pattern Recognition.2011, 6
[3]
Some connectivity based cluster validity indices.[J].Sriparna Saha;Sanghamitra Bandyopadhyay.Applied Soft Computing Journal.2011, 5
[4]
Analysis of parameter selections for fuzzy c -means.[J].Kuo-Lung Wu.Pattern Recognition.2011, 1
[5]
Model order selection for multiple cooperative swarms clustering using stability analysis.[J].Abbas Ahmadi;Fakhri Karray;Mohamed S. Kamel.Information Sciences.2010, 1
[6]
Towards a standard methodology to evaluate internal cluster validity indices.[J].Ibai Gurrutxaga;Javier Muguerza;Olatz Arbelaitz;Jesús M. Pérez;José I. Martín.Pattern Recognition Letters.2010, 3
[7]
Normality-based validation for crisp clustering.[J].Luis F. Lago-Fernández;Fernando Corbacho.Pattern Recognition.2009, 3
[8]
A stability based validity method for fuzzy clustering.[J].M. Falasconi;A. Gutierrez;M. Pardo;G. Sberveglieri;S. Marco.Pattern Recognition.2009, 4
[9]
Cluster validation using information stability measures.[J].Damaris Pascual;Filiberto Pla;J. Salvador Sánchez.Pattern Recognition Letters.2009, 6
[10]
External validation measures for K -means clustering: A data distribution perspective.[J].Junjie Wu;Jian Chen;Hui Xiong;Ming Xie.Expert Systems With Applications.2008, 3