一种改进的K-means聚类算法

被引:13
作者
张建民
机构
[1] 安徽省地方税务局信息中心
关键词
聚类分析; K-means算法; 离群点数据;
D O I
暂无
中图分类号
TP182 [专家系统、知识工程];
学科分类号
1111 ;
摘要
本文提出了一种带离群点数据过滤的K-means改进算法。该算法根据离群点数据特征制定了离群点数据的发现规则,并在原算法中加入了离群点数据的发现和处理步骤。通过对给定的具有普遍意义的数据实验表明,改进后算法能较为稳定的发现数据集中存在的"离群点数据",这些"离群点数据"符合离群点数据特征;同时在剔除这些极少数离群点数据后,显著提高了聚类结果簇的凝聚度,从而有效克服了离群点数据对K-means算法的影响,使聚类效果得以显著提高。
引用
收藏
页码:233 / 234
页数:2
相关论文
共 5 条
  • [1] 数据挖掘与知识发现.[M].李雄飞;李军编著;.高等教育出版社.2003,
  • [2] 数据仓库原理与应用.[M].邓苏等编著;张维明主编;.电子工业出版社.2002,
  • [3] 数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
  • [4] 增强型K-means聚类算法在入侵检测中的应用
    高继森
    赵杰
    张忠辅
    张晶
    [J]. 微计算机信息, 2008, (09) : 72 - 73
  • [5] 一种增强的k-means聚类算法
    蒋盛益
    李庆华
    [J]. 计算机工程与科学, 2006, (11) : 56 - 59