一种基于网格的层次聚类算法

被引:1
作者
姚玉钦 [1 ]
李金广 [2 ]
机构
[1] 安阳工学院教务处
[2] 安阳工学院计算机科学与信息工程系
关键词
数据挖掘; 聚类; 层次距离; 网格聚类;
D O I
10.16366/j.cnki.1000-2367.2009.04.057
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性.
引用
收藏
页码:42 / 44
页数:3
相关论文
共 2 条
[1]   基于层次划分的最佳聚类数确定方法 [J].
陈黎飞 ;
姜青山 ;
王声瑞 .
软件学报, 2008, (01) :62-72
[2]  
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,