基于密度RPCL的K-means算法

被引:5
作者
谢娟英 [1 ,2 ]
郭文娟 [2 ]
谢维信 [3 ]
高新波 [1 ]
机构
[1] 西安电子科技大学电子工程学院
[2] 陕西师范大学计算机科学学院
[3] 深圳大学信息工程学院
关键词
RPCL; K-means; 密度; 聚类数目; 初始聚类中心;
D O I
10.16152/j.cnki.xdxbzr.2012.04.008
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。
引用
收藏
页码:570 / 576
页数:7
相关论文
共 18 条
[1]   基于样本空间分布密度的初始聚类中心优化K-均值算法 [J].
谢娟英 ;
郭文娟 ;
谢维信 ;
高新波 .
计算机应用研究, 2012, 29 (03) :888-892
[2]   基于样本空间分布密度的改进次胜者受罚竞争学习算法 [J].
谢娟英 ;
郭文娟 ;
谢维信 ;
高新波 .
计算机应用, 2012, 32 (03) :638-642
[3]   一种确定最佳聚类数的新算法 [J].
谢娟英 ;
马箐 ;
谢维信 .
陕西师范大学学报(自然科学版), 2012, 40 (01) :13-18
[4]   基于近邻传播算法的最佳聚类数确定方法比较研究 [J].
周世兵 ;
徐振源 ;
唐旭清 .
计算机科学, 2011, 38 (02) :225-228
[5]   一种改进的k-means初始聚类中心选取算法 [J].
韩凌波 ;
王强 ;
蒋正锋 ;
郝志强 .
计算机工程与应用, 2010, 46 (17) :150-152
[6]   半监督的改进K-均值聚类算法 [J].
汪军 ;
王传玉 ;
周鸣争 .
计算机工程与应用, 2009, 45 (28) :137-139
[7]   基于最优划分的K-Means初始聚类中心选取算法 [J].
张健沛 ;
杨悦 ;
杨静 ;
张泽宝 .
系统仿真学报, 2009, (09) :2586-2590
[8]   一种优化初始中心点的K-means算法 [J].
汪中 ;
刘贵全 ;
陈恩红 .
模式识别与人工智能, 2009, 22 (02) :299-304
[9]   基于近邻传播算法的半监督聚类 [J].
肖宇 ;
于剑 .
软件学报, 2008, (11) :2803-2813
[10]   改进K-means的空间聚类算法 [J].
赵伟 ;
张姝 ;
李文辉 .
计算机应用研究, 2008, (07) :1995-1997