最小方差优化初始聚类中心的K-means算法

被引:84
作者
谢娟英
王艳娥
机构
[1] 陕西师范大学计算机科学学院
关键词
聚类; K-means算法; 方差; 紧密度; 初始聚类中心;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。
引用
收藏
页码:205 / 211+223 +223
页数:8
相关论文
共 13 条
[1]   基于密度RPCL的K-means算法 [J].
谢娟英 ;
郭文娟 ;
谢维信 ;
高新波 .
西北大学学报(自然科学版), 2012, 42 (04) :570-576
[2]   基于样本空间分布密度的初始聚类中心优化K-均值算法 [J].
谢娟英 ;
郭文娟 ;
谢维信 ;
高新波 .
计算机应用研究, 2012, 29 (03) :888-892
[3]   基于密度网格的数据流聚类算法 [J].
米源 ;
杨燕 ;
李天瑞 .
计算机科学, 2011, 38 (12) :178-181
[4]   基于初始聚类中心优化的K-均值算法 [J].
王赛芳 ;
戴芳 ;
王万斌 ;
张晓宇 .
计算机工程与科学, 2010, 32 (10) :105-107+116
[5]   一种改进的k-means初始聚类中心选取算法 [J].
韩凌波 ;
王强 ;
蒋正锋 ;
郝志强 .
计算机工程与应用, 2010, 46 (17) :150-152
[6]   一种优化初始中心点的K-means算法 [J].
汪中 ;
刘贵全 ;
陈恩红 .
模式识别与人工智能, 2009, 22 (02) :299-304
[7]   聚类有效性评价综述 [J].
杨燕 ;
靳蕃 ;
KAMEL Mohamed .
计算机应用研究, 2008, (06) :1630-1632+1638
[8]   K-means算法的初始聚类中心的优化 [J].
赖玉霞 ;
刘建平 .
计算机工程与应用, 2008, (10) :147-149
[9]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[10]   初始化K-means的谱方法 [J].
钱线 ;
黄萱菁 ;
吴立德 .
自动化学报, 2007, (04) :342-346