优化初始聚类中心的改进K-means算法

被引:33
作者
唐东凯 [1 ]
王红梅 [1 ]
胡明 [1 ,2 ]
刘钢 [1 ]
机构
[1] 长春工业大学计算机科学与工程学院
[2] 长春工程学院
关键词
K-means算法; 初始聚类中心; 离群因子; 取样因子; 最大最小距离;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的数据集上,引入取样因子α,得到候选初始中心点集.最后,根据最大最小距离的思想,在候选初始中心点集上选取k个数据对象作为初始聚类中心.实验结果表明,在时间基本相同的情况下,提出的改进算法相对K-means、K-means++算法具有较好的稳定性和较高的聚类准确率,并且聚类的平均迭代次数也相对较小.
引用
收藏
页码:1819 / 1823
页数:5
相关论文
共 10 条
[1]   一种基于最大最小距离和SSE的自适应聚类算法 [J].
成卫青 ;
卢艳红 .
南京邮电大学学报(自然科学版), 2015, 35 (02) :102-107
[3]   最小方差优化初始聚类中心的K-means算法 [J].
谢娟英 ;
王艳娥 .
计算机工程, 2014, 40 (08) :205-211+223
[4]   基于离群点检测的K-means算法 [J].
冷泳林 ;
张清辰 ;
赵亮 ;
鲁富宇 .
渤海大学学报(自然科学版), 2014, 35 (01) :34-38+48
[5]   基于密度的K-means聚类中心选取的优化算法 [J].
周炜奔 ;
石跃祥 .
计算机应用研究, 2012, 29 (05) :1726-1728
[6]   基于密度的改进K均值算法及实现 [J].
傅德胜 ;
周辰 .
计算机应用, 2011, 31 (02) :432-434
[7]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[8]  
LOF[J] . Markus M. Breunig,Hans-Peter Kriegel,Raymond T. Ng,J?rg Sander.ACM SIGMOD Record . 2000 (2)
[9]   A New Initialization Technique for Generalized Lloyd Iteration [J].
Katsavounidis, Ioannis ;
Kuo, C. -C. Jay ;
Zhang, Zhen .
IEEE SIGNAL PROCESSING LETTERS, 1994, 1 (10) :144-146
[10]  
Communication and Computing Systems .2 Goel L,Jain N,Srivastava S. CRC Press . 2016