K-Means聚类算法的研究

被引:134
作者
周爱武
于亚飞
机构
[1] 安徽大学计算机科学与技术学院
关键词
K-Means算法; 初始聚类中心; 孤立点;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
K-Means算法是一种经典的聚类算法,有很多优点,也存在许多不足。比如初始聚类数K要事先指定,初始聚类中心选择存在随机性,算法容易生成局部最优解,受孤立点的影响很大等。文中主要针对K-Means算法初始聚类中心的选择以及孤立点问题加以改进,首先计算所有数据对象之间的距离,根据距离和的思想排除孤立点的影响,然后提出了一种新的初始聚类中心选择方法,并通过实验比较了改进算法与原算法的优劣。实验表明,改进算法受孤立点的影响明显降低,而且聚类结果更接近实际数据分布。
引用
收藏
页码:62 / 65
页数:4
相关论文
共 9 条