基于最小方差的自适应K-均值初始化方法

被引:7
作者
肖洋
李平
王鹏
邱宁佳
机构
[1] 长春理工大学计算机科学技术学院
关键词
聚类; K-均值; 方差; 初始聚类中心;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动。针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优。首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心。实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类。
引用
收藏
页码:140 / 144+149 +149
页数:6
相关论文
共 9 条
[1]   一种非对称距离下的层次聚类算法 [J].
韩忠明 ;
陈妮 ;
张慧 ;
杨伟杰 .
模式识别与人工智能, 2014, 27 (05) :410-416
[2]   K-means聚类算法优化方法的研究 [J].
于海涛 ;
李梓 ;
姚念民 .
小型微型计算机系统, 2012, 33 (10) :2273-2277
[3]   面向聚类的数据隐藏发布研究 [J].
倪巍伟 ;
陈耿 ;
崇志宏 ;
吴英杰 .
计算机研究与发展, 2012, 49 (05) :1095-1104
[4]   一种改进的k-means初始聚类中心选取算法 [J].
韩凌波 ;
王强 ;
蒋正锋 ;
郝志强 .
计算机工程与应用, 2010, 46 (17) :150-152
[5]   K-means聚类算法的研究 [J].
韩晓红 ;
胡彧 .
太原理工大学学报, 2009, (03) :236-239
[6]   一种优化初始中心点的K-means算法 [J].
汪中 ;
刘贵全 ;
陈恩红 .
模式识别与人工智能, 2009, 22 (02) :299-304
[7]   K-means算法的初始聚类中心的优化 [J].
赖玉霞 ;
刘建平 .
计算机工程与应用, 2008, (10) :147-149
[8]   优化K-means初始聚类中心研究 [J].
毛韶阳 ;
李肯立 .
计算机工程与应用, 2007, (22) :179-181+219
[9]  
Careful Seeding Method based on Independent Components Analysis for k-means Clustering[J] . Takashi Onoda,Miho Sakai,Seiji Yamada.Journal of Emerging Technologies in Web Intelligence . 2012 (1)