一种改进的K-means聚类算法

被引:24
作者
连凤娜
吴锦林
唐琦
机构
[1] 厦门大学信息科学与技术学院
关键词
K-means算法; 聚类; 孤立点;
D O I
10.19414/j.cnki.1005-1228.2008.01.014
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
K-means算法是最常用的聚类算法之一,有很多的优点,但也存在着不足。它不仅对样本的输入顺序敏感,可能产生局部最优解,而且受孤立点的影响很大。文章正是针对这些不足,提出了一种改进的K-means算法,主要从数据预处理、初始聚类中心的选择方面进行了改进,并做了改进前后算法的对比实验。结果表明,改进后的算法不但更具稳定性,准确度也高,受孤立点的影响也大大降低。
引用
收藏
页码:38 / 40
页数:3
相关论文
共 4 条
[1]  
基于遗传算法的k-means聚类方法的研究.[D].金微.河海大学.2007, 06
[2]   对k-means聚类算法的改进 [J].
袁方 ;
孟增辉 ;
于戈 .
计算机工程与应用, 2004, (36) :177-178+232
[3]   基于距离的孤立点检测研究 [J].
陆声链 ;
林士敏 ;
不详 .
计算机工程与应用 , 2004, (33) :73-75+94
[4]  
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,