一种基于边缘度密度距的聚类算法

被引：6

作者：

吴明晖 ^{[1
]}

张红喜 ^{[1
,2
]}

金苍宏 ^{[2
]}

蔡文明 ^{[2
]}

机构：

[1] 浙江大学城市学院计算机科学与工程学系

[2] 浙江大学计算机科学与技术学院

来源：

计算机科学 | 2014年 / 41卷 / 08期

关键词：

聚类; 网格; 密度; Caed; Dbscan; Kmeans;

D O I：

暂无

中图分类号：

TP311.13 [];

学科分类号：

1201 ;

摘要：

传统网格聚类算法聚类质量低,而密度聚类算法时间复杂度高。针对两类算法各自的缺点,结合它们的聚类思想提出了一种新的聚类算法。该算法提出了边缘度密度距作为新的密度度量,并在此基础上逐步确定了类的定义和聚类过程的定义。算法前期通过网格划分操作统计记录了待聚类数据的初始信息,以供随后的k近邻统计使用。在寻找聚类中心点时使用了桶排序的策略,使得算法能快速地选出下一个聚类中心点。随后的聚类步骤是迭代搜索并检验当前类中未检验的k近邻是否满足密度可达性来完成聚类。理论分析和实验测试的结果表明,该算法不仅保持了较高的聚类精度,而且有接近线性的低时间复杂度。

引用

页码：245 / 249

页数：5