一种改进的自适应快速AF-DBSCAN聚类算法

被引:93
作者
周治平
王杰锋
朱书伟
孙子文
机构
[1] 江南大学物联网工程学院
关键词
密度聚类; DBSCAN; 区域查询; 全局参数; KNN分布; 数学统计分析;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
基于密度的DBSCAN聚类算法可以识别任意形状簇,但存在全局参数Eps与Min Pts的选择需人工干预,采用的区域查询方式过程复杂且易丢失对象等问题,提出了一种改进的参数自适应以及区域快速查询的密度聚类算法。根据KNN分布与数学统计分析自适应计算出最优全局参数Eps与Min Pts,避免聚类过程中的人工干预,实现了聚类过程的全自动化。通过改进种子代表对象选取方式进行区域查询,无需漏检操作,有效提高了聚类的效率。对4种典型数据集的密度聚类实验结果表明,本文算法使得聚类精度提高了8.825%,聚类的平均时间减少了0.92 s。
引用
收藏
页码:93 / 98
页数:6
相关论文
共 7 条
[1]
Algorithm to determine ε-distance parameter in density based clustering [J].
Jahirabadkar, Sunita ;
Kulkarni, Parag .
EXPERT SYSTEMS WITH APPLICATIONS, 2014, 41 (06) :2939-2946
[2]
A new hybrid method based on partitioning-based DBSCAN and ant clustering [J].
Jiang, Hua ;
Li, Jing ;
Yi, Shenghe ;
Wang, Xiangyang ;
Hu, Xin .
EXPERT SYSTEMS WITH APPLICATIONS, 2011, 38 (08) :9373-9381
[3]
Improving DBSCAN's execution time by using a pruning technique on bit vectors [J].
Mimaroglu, Selim ;
Aksehirli, Emin .
PATTERN RECOGNITION LETTERS, 2011, 32 (13) :1572-1580
[4]
一种基于密度最大值的聚类算法 [J].
王晶 ;
夏鲁宁 ;
荆继武 .
中国科学院研究生院学报, 2009, 26 (04) :539-548
[5]
一种分布式隐私保护的密度聚类算法 [J].
吉根林 ;
姚瑶 .
智能系统学报, 2009, 4 (02) :137-141
[6]
A statistical information-based clustering approach in distance space [J].
Yue Shi-hong ;
Li Ping ;
Guo Ji-dong ;
Zhou Shui-geng .
Journal of Zhejiang University-SCIENCE A, 2005, 6 (1) :71-78
[7]
一种基于密度的快速聚类算法 [J].
周水庚 ;
周傲英 ;
曹晶 ;
胡运发 .
计算机研究与发展, 2000, (11) :1287-1292