基于平均差异度优选初始聚类中心的改进K-均值聚类算法

被引:35
作者
李武
赵娇燕
严太山
机构
[1] 湖南理工学院信息与通信工程学院
基金
湖南省自然科学基金;
关键词
K-均值聚类; 初始聚类中心; 样本差异度;
D O I
10.13195/j.kzyjc.2016.0274
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快.
引用
收藏
页码:759 / 762
页数:4
相关论文
共 12 条
[1]   基于平均密度优化初始聚类中心的k-means算法 [J].
邢长征 ;
谷浩 .
计算机工程与应用 , 2014, (20) :135-138
[2]   基于K均值聚类的二进制传感器网络多目标定位方法 [J].
黄月 ;
吴成东 ;
张云洲 ;
程龙 ;
孙尧 .
控制与决策, 2013, (10) :1497-1501
[3]   基于密度期望和有效性指标的K-均值算法 [J].
何云斌 ;
肖宇鹏 ;
万静 ;
李松 .
计算机工程与应用, 2013, 49 (24) :105-111
[4]   基于词性和中心点改进的文本聚类方法 [J].
施侃晟 ;
刘海涛 ;
宋文涛 .
模式识别与人工智能, 2012, 25 (06) :996-1001
[5]   基于密度加权的粗糙K-均值聚类改进算法 [J].
郑超 ;
苗夺谦 ;
王睿智 .
计算机科学, 2009, 36 (03) :220-222
[6]   基于遗传算法的K均值聚类分析 [J].
赖玉霞 ;
刘建平 ;
杨国兴 .
计算机工程, 2008, (20) :200-202
[7]   基于相离度和可能度的偏差最大化多属性决策方法 [J].
徐泽水 .
控制与决策, 2001, (S1) :818-821
[8]  
Applying subclustering and L p distance in Weighted K-Means with distributed centroids[J] . Renato Cordeiro de Amorim,Vladimir Makarenkov.Neurocomputing . 2015
[9]   K-means Algorithm Based on Particle Swarm Optimization for the Identification of Rock Discontinuity Sets [J].
Li, Yanyan ;
Wang, Qing ;
Chen, Jianping ;
Xu, Liming ;
Song, Shengyuan .
ROCK MECHANICS AND ROCK ENGINEERING, 2015, 48 (01) :375-385
[10]  
The MinMax k -means clustering algorithm[J] . Grigorios Tzortzis,Aristidis Likas.Pattern Recognition . 2014