基于密度的改进BIRCH聚类算法

被引:39
作者
韦相
机构
[1] 红河学院计算机科学与技术系
关键词
聚类; CF树; 密度; 质心;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对传统的BIRCH算法用直径来控制聚类的边界,对非球形聚类效果不佳,甚至会把非球状的簇分割为不同簇这一缺点,对BIRCH算法进行改进,改进算法首先建立多棵CF树,每棵CF树代表一个簇,并结合DBSCAN算法的密度可达的思想。该算法能对任意形状的簇进行准确的聚类。实验表明,算法能通过一次扫描进行有效聚类,时间复杂度与BIRCH算法相同,对大规模数据集具有较高的处理速度,实现了动态聚类,并可以准确地对任意形状的簇进行聚类并发现噪声点。
引用
收藏
页码:201 / 205
页数:5
相关论文
共 5 条
[1]
一种改进的BIRCH分层聚类算法 [J].
赵玉艳 ;
郭景峰 ;
郑丽珍 ;
李晶 .
计算机科学, 2008, (03) :180-182+208
[2]
多阈值BIRCH聚类算法及其应用 [J].
邵峰晶 ;
张斌 ;
于忠清 .
计算机工程与应用, 2004, (12) :174-176+195
[3]
一种基于密度的快速聚类算法 [J].
周水庚 ;
周傲英 ;
曹晶 ;
胡运发 .
计算机研究与发展, 2000, (11) :1287-1292
[4]
Data clustering[J] A. K. Jain;M. N. Murty;P. J. Flynn ACM Computing Surveys (CSUR) 1999,
[5]
STING: A statistical information grid approach to spatial data mining Wang W; Yang J; Muntz RR; Proceedings of the 23rd International Conference on Very Large Data Bases 1997,