SA-DBSCAN:一种自适应基于密度聚类算法

被引:79
作者
夏鲁宁
荆继武
机构
[1] 中国科学院研究生院,信息安全国家重点实验室
关键词
数据挖掘; 聚类; DBSCAN; SA-DBSCAN;
D O I
暂无
中图分类号
TP311.13 []; TP18 [人工智能理论];
学科分类号
1201 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理.DBSCAN算法需要人为确定Eps和minPts2个参数,导致聚类过程需人工干预才能进行.在DBSCAN的基础上提出了SA-DBSCAN聚类算法,通过分析数据集统计特性来自动确定Eps和minPts参数,从而避免了聚类过程的人工干预,实现聚类过程的全自动化.实验表明,SA-DBSCAN能够选择合理的Eps和minPts参数并得到较高准确度的聚类结果.
引用
收藏
页码:530 / 538
页数:9
相关论文
共 4 条
[1]  
数据挖掘导论.[M].(美)Pang-NingTan;(美)MichaelSteinbach;(美)VipinKumar著;范明;范宏建等译;.人民邮电出版社.2006,
[2]   A statistical information-based clustering approach in distance space [J].
Yue Shi-hong ;
Li Ping ;
Guo Ji-dong ;
Zhou Shui-geng .
Journal of Zhejiang University-SCIENCE A, 2005, 6 (1) :71-78
[3]   屏蔽了输入参数敏感性的DBSCAN改进算法 [J].
蔡颖琨 ;
谢昆青 ;
马修军 .
北京大学学报(自然科学版), 2004, (03) :480-486
[4]   基于Web-Log Mining的Web文档聚类 [J].
苏中 ;
马少平 ;
杨强 ;
张宏江 .
软件学报, 2002, (01) :99-104