一种基于密度的快速聚类算法

被引:92
作者
周水庚
周傲英
曹晶
胡运发
机构
[1] 复旦大学计算机科学系!上海
关键词
空间数据库; 数据挖掘; 聚类; 密度; 快速算法; 代表对象;
D O I
暂无
中图分类号
TP311 [程序设计、软件工程];
学科分类号
摘要
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 .
引用
收藏
页码:1287 / 1292
页数:6
相关论文
共 1 条
  • [1] Automatic subspace clustering of high dimensional data for data mining applications .2 Agrawal R et al. In: Proc of the ACM SIGMOD Int’ l Conf on Management of Data . 1998