聚类算法综述

被引:99
作者
伍育红
机构
[1] 重庆邮电大学移通学院
关键词
网格聚类; 密度阈值递减; 多阶段聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据挖掘技术可以从大量数据中发现潜在的、有价值的知识,它给人们在信息时代所积累的海量数据赋予了新的意义。随着数据挖掘技术的迅速发展,作为其重要的组成部分,网格聚类技术已经被广泛应用于数据分析、图像处理、市场研究等许多领域。网格聚类算法研究已经成为数据挖掘研究领域中非常活跃的一个研究课题。介绍了数据挖掘理论,对网格聚类算法进行了深入的分析研究。在研究了传统网格聚类算法的基础上,提出了一些改进的网格聚类算法,这些算法相比传统网格聚类算法有更好的聚类质量和效率。在分析了传统的多密度聚类算法的基础上,提出了基于网格的多密度聚类算法(Grid-based Clustering Algorithm for Multi-density)[1],该算法主要采用密度阈值递减的多阶段聚类技术提取不同密度的聚类,同时对聚类结果进行了人工干预。研究结果表明,基于网格的多密度聚类算法不仅能够对数据集进行正确的聚类,同时还能有效地弥补孤立点检测,有效地解决了传统多密度聚类算法不能有效识别孤立点和噪声的缺陷。基于网格的多密度聚类算法比传统的共享近邻SNN算法精度高,适合于均匀密度数据集、大部分多密度数据集,并且可以发现任意形状的聚类,对噪声数据和数据输入顺序不敏感,但对小部分多密度数据集的聚类结果不理想[1]。
引用
收藏
页码:491 / 499+524 +524
页数:10
相关论文
共 5 条
  • [1] 基于网格聚类技术的离群点挖掘算法
    曹洪其
    余岚
    孙志挥
    [J]. 计算机工程, 2006, (11) : 119 - 121+124
  • [2] 基于网格方法的聚类算法研究[D]. 孙玉芬.华中科技大学. 2006
  • [3] 数据仓库与数据挖掘[M]. 清华大学出版社 , 陈志泊, 2009
  • [4] 数据仓库与数据挖掘的原理及应用[M]. 高等教育出版社 , 李志刚, 2008
  • [5] 数据挖掘导论[M]. 人民邮电出版社 , (美)Pang-NingTan, 2006