基于密度的增量式网格聚类算法(英文)

被引:26
作者
陈宁
陈安
周龙骧
机构
[1] 中国科学院数学与系统科学研究院
[2] 中国科学院科技政策与管理科学研究所
[3] 中国科学院数学与系统科学研究院 北京
[4] 北京 中国科学院软件研究所软件工程技术研究开发中心 北京
[5] 北京
关键词
聚类; 网格; 增量算法;
D O I
10.13328/j.cnki.jos.2002.01.001
中图分类号
TP311.132.3 [];
学科分类号
1201 ;
摘要
提出基于密度的网格聚类算法GDCA,发现大规模空间数据库中任意形状的聚类.该算法首先将数据空间划分成若干体积相同的单元,然后对单元进行聚类.只有密度不小于给定阈值的单元才得到扩展,从而大大降低了时间复杂性.在GDCA的基础上,给出增量式聚类算法IGDCA,适用于数据的批量更新.
引用
收藏
页码:1 / 7
页数:7
相关论文
共 5 条
[1]  
Incremental clustering for mining in a data warehousing environment. Ester,M,Kriegel,H.-P,Sander,J. et. al. Proceedings of the24thInternationalConference onVeryLargeDataBases . 1998
[2]  
Automatic subspace clustering of high dimensional data for data mining application. Agrawal R, Gehrke J, Gunopolos D, et al. Proceedings of the ACM SIGMOD International Conference on Management of Data . 1998
[3]  
Grid-Clustering: An Efficient Hierarchical Clustering Method for Very Large Data Sets. Schikuta E. Proceedings of the 13th Intrnational Conference on Pattern Recognition . 1996
[4]  
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. Martin Ester,Hans-Peter Kriegel el. Proceedings of 2nd international conference on knowledge discovery and data mining . 1996
[5]  
A Fast Algorithm for Density-Based Clustering. B.Zhou,D.Cheng,B.Kao. Proceedings of the 3rd Pacific Asia Conference on Knowledge Discovery and Data Mining . 1999