K均值聚类算法初始质心选择的改进

被引:14
作者
孙可 [1 ,2 ]
刘杰 [1 ]
王学颖 [1 ]
机构
[1] 沈阳师范大学科信软件学院
[2] 沈阳师范大学学报编辑部
关键词
聚类; K均值聚类算法; 初始质心; 密度; 最近邻相似度;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的随机指定初始质心的缺点,提出了基于密度和最近邻相似度的初始质心选择算法,实验显示该算法可以生成质量较高而且较稳定的聚类结果,但是改进的算法需要事先设定最近邻相似度的阈值计算量较大等缺点,还有待改进。
引用
收藏
页码:448 / 450
页数:3
相关论文
共 10 条