一种基于边缘度密度距的聚类算法

被引:6
作者
吴明晖 [1 ]
张红喜 [1 ,2 ]
金苍宏 [2 ]
蔡文明 [2 ]
机构
[1] 浙江大学城市学院计算机科学与工程学系
[2] 浙江大学计算机科学与技术学院
关键词
聚类; 网格; 密度; Caed; Dbscan; Kmeans;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
传统网格聚类算法聚类质量低,而密度聚类算法时间复杂度高。针对两类算法各自的缺点,结合它们的聚类思想提出了一种新的聚类算法。该算法提出了边缘度密度距作为新的密度度量,并在此基础上逐步确定了类的定义和聚类过程的定义。算法前期通过网格划分操作统计记录了待聚类数据的初始信息,以供随后的k近邻统计使用。在寻找聚类中心点时使用了桶排序的策略,使得算法能快速地选出下一个聚类中心点。随后的聚类步骤是迭代搜索并检验当前类中未检验的k近邻是否满足密度可达性来完成聚类。理论分析和实验测试的结果表明,该算法不仅保持了较高的聚类精度,而且有接近线性的低时间复杂度。
引用
收藏
页码:245 / 249
页数:5
相关论文
共 2 条
[1]   网格聚类算法 [J].
赵慧 ;
刘希玉 ;
崔海青 .
计算机技术与发展, 2010, 20 (09) :83-85+89
[2]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61