最小化误差平方和k-means初始聚类中心优化方法

被引:41
作者
周本金
陶以政
纪斌
谢永辉
机构
[1] 中国工程物理研究院计算机应用研究所
关键词
聚类; k-均值算法; 误差平方和; 孤立点;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
传统的k-均值算法对初始聚类中心和孤立点敏感,文中以最大程度地减少误差平方和为基本思想,提出一种最大化减少当前误差平方和的k-means初始聚类中心优化方法。在初始聚类中心选择阶段,每次增加聚类中心时,计算所有数据点作为当前聚类中心能够减少的误差平方和,选择能够最大化减少误差平方和的数据点作为聚类初始中心。利用真实数据集,同其他算法进行对比,实验结果表明该方法在选择初始聚类中心方面能够有效地减少聚类的迭代次数,提高聚类质量。同时人工模拟数据表明该方法对孤立点相对不敏感。
引用
收藏
页码:48 / 52
页数:5
相关论文
共 17 条
[1]   在高维数据上的近邻传播聚类降维研究 [J].
李界家 ;
郭鹏程 ;
韩忠华 .
控制工程, 2016, 23 (09) :1418-1422
[2]   基于改进K均值聚类的异常检测算法 [J].
左进 ;
陈泽茂 .
计算机科学, 2016, 43 (08) :258-261
[3]   面向大数据处理的并行优化抽样聚类K-means算法 [J].
周润物 ;
李智勇 ;
陈少淼 ;
陈京 ;
李仁发 .
计算机应用, 2016, 36 (02) :311-315+329
[4]   基于最小方差的自适应K-均值初始化方法 [J].
肖洋 ;
李平 ;
王鹏 ;
邱宁佳 .
长春理工大学学报(自然科学版), 2015, 38 (05) :140-144+149
[5]   最小方差优化初始聚类中心的K-means算法 [J].
谢娟英 ;
王艳娥 .
计算机工程, 2014, 40 (08) :205-211+223
[6]   最大距离法选取初始簇中心的K-means文本聚类算法的研究 [J].
翟东海 ;
鱼江 ;
高飞 ;
于磊 ;
丁锋 .
计算机应用研究, 2014, 31 (03) :713-715+719
[7]   基于密度的改进K均值算法及实现 [J].
傅德胜 ;
周辰 .
计算机应用, 2011, 31 (02) :432-434
[8]   基于密度和最近邻的K-means文本聚类算法 [J].
张文明 ;
吴江 ;
袁小蛟 .
计算机应用, 2010, 30 (07) :1933-1935
[9]   基于模拟退火与K均值聚类的入侵检测算法 [J].
胡艳维 ;
秦拯 ;
张忠志 .
计算机科学, 2010, 37 (06) :122-124
[10]   高维数据聚类方法综述 [J].
贺玲 ;
蔡益朝 ;
杨征 .
计算机应用研究, 2010, 27 (01) :23-26+31