一种基于网格密度与空间划分树的聚类算法

被引:16
作者
曾东海 [1 ]
米红 [2 ]
刘力丰 [1 ]
机构
[1] 厦门大学信息科学与技术学院模式识别与智能系统研究所
[2] 浙江大学公共管理学院
关键词
聚类; 网格密度; 空间划分树;
D O I
暂无
中图分类号
TP311.13 []; TP18 [人工智能理论];
学科分类号
1201 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.文章提出了一种新的基于网格密度和空间划分树的CGDSPT(Clustering based on Grid-Density and Spatial Partition Tree)聚类算法.其创新点在于,将数据空间划分成多个体积相等的单元格,然后基于单元格定义了密度、簇等概念,对单元格建立了一种基于空间划分的空间索引结构(空间划分树)来对数据进行聚类.CGDSPT算法保持了基于密度的聚类算法的上述优点,而且CGDSPT算法具有线性的时间复杂性,因此CGDSPT算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CGDSPT算法的优点.
引用
收藏
页码:125 / 131+137 +137
页数:8
相关论文
共 2 条
[1]   Analysis of range search for random k-d trees [J].
Philippe Chanzy ;
Luc Devroye ;
Carlos Zamora-Cura .
Acta Informatica, 2001, 37 :355-383
[2]  
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. Martin Ester,Hans-Peter Kriegel,J Sander,Xiaowei Xu. Proc. of 2nd Int. Conf. on Knowledge Discovery and Data Mining (KDD-96) . 1996