基于相似度的网格聚类算法

被引:9
作者
刘敏娟
柴玉梅
张西芝
机构
[1] 郑州大学信息工程学院
关键词
网格; 相似度; 阈值函数; 核;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了一种基于相似度的网格聚类算法(SGCA)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用边界点阈值函数提取类的边界点,最后利用相似度方法进行聚类。SGCA算法只要求对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,它不仅适用于综合数据集,而且对高维数据集也具有较好的聚类结果。还引进了网格核技术,进一步改善了SGCA算法的时间复杂度。
引用
收藏
页码:198 / 201
页数:4
相关论文
共 2 条
[1]  
Data mining:concepts and techniques. Han Jia-wei,Kamber M. . 2000
[2]  
Finding groups in data:an introduction to cluster analysis. Kaufman L,Rousseeuw P J. . 1990