一种基于高斯分布的自适应DBSCAN算法

被引:58
作者
陈刚 [1 ]
刘秉权 [2 ]
吴岩 [3 ]
机构
[1] 广东科技学院计算机系
[2] 哈尔滨工业大学计算机科学与技术学院
[3] 哈尔滨工业大学软件学院
关键词
数据集; 高斯分布; 密度层次; 聚类效果; 噪音率;
D O I
10.19304/j.cnki.issn1000-7180.2013.03.007
中图分类号
TP311.13 [];
学科分类号
摘要
针对传统的DBSCAN算法只能依靠经验来设置阈值(minPts,Eps)和无法对多密度数据集进行有效聚类的不足,提出了一种可适用于所有密度分布特征的数据集的基于高斯分布的自适应DBSCAN算法.该算法根据数据集的特点寻找最大的聚类效果指数(CEI)来确定minPts,通过Distk图的层次数确定Eps个数并通过高斯分布中的参数估计来确定每个密度层次Eps大小,最后用所求得阈值进行聚类.将该算法与传统的DBSCAN算法分别应用于单密度数据集和多密度数据集,结果显示该算法更有效.
引用
收藏
页码:27 / 30+34 +34
页数:5
相关论文
共 6 条
[1]
基于DBSCAN聚类算法的闪电临近预报模型 [J].
侯荣涛 ;
朱斌 ;
冯民学 ;
史鑫明 ;
路郁 .
计算机应用, 2012, 32 (03) :847-851
[2]
一种改进的基于密度的聚类算法 [J].
许虎寅 ;
王治和 .
微电子学与计算机, 2012, 29 (02) :44-47+53
[3]
SA-DBSCAN:一种自适应基于密度聚类算法 [J].
夏鲁宁 ;
荆继武 .
中国科学院研究生院学报, 2009, 26 (04) :530-538
[4]
一种基于密度的文本聚类挖掘算法 [J].
赵康 ;
陆介平 ;
倪巍伟 ;
王桂平 .
计算机应用研究, 2009, 26 (01) :124-126
[5]
多密度阈值的DBSCAN改进算法 [J].
谭颖 ;
胡瑞飞 ;
殷国富 .
计算机应用, 2008, (03) :745-748
[6]
A statistical information-based clustering approach in distance space [J].
Yue Shi-hong ;
Li Ping ;
Guo Ji-dong ;
Zhou Shui-geng .
Journal of Zhejiang University-SCIENCE A, 2005, 6 (1) :71-78