层次聚类算法的改进及分析

被引:7
作者
郭晓娟 [1 ]
刘晓霞 [1 ]
李晓玲 [2 ]
机构
[1] 西北大学
[2] 中国地质大学
关键词
聚类; 层次聚类; 谱系图; 簇; POP;
D O I
暂无
中图分类号
TP301. [];
学科分类号
081202 ;
摘要
层次凝聚算法是一个非常有用的聚类算法,它在迭代地凝聚每次接近对直到所有的数据都属于同一个簇。但层次聚类也存在着几个缺点,如聚类时的时空复杂性高;聚类的簇效率低、误差较大等。经验研究表明,大部分HAC算法都有这样一个趋势:除了在谱系图的顶层,所有低层聚类的簇都是比较小的并且很接近于其他的簇,提出了一种改进算法能够减小时空复杂性并能验证其正确性,分析与实验都证明这种方法是非常有效的。
引用
收藏
页码:243 / 244+268 +268
页数:3
相关论文
共 3 条
[1]  
数据挖掘教程.[M].()MargaretH.Dunham著;郭崇慧;田凤占;靳晓明等译;.清华大学出版社.2005,
[2]  
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[3]   EFFICIENT ALGORITHMS FOR AGGLOMERATIVE HIERARCHICAL-CLUSTERING METHODS [J].
DAY, WHE ;
EDELSBRUNNER, H .
JOURNAL OF CLASSIFICATION, 1984, 1 (01) :7-24