共 18 条
基于密度RPCL的K-means算法
被引:5
作者:
谢娟英
[1
,2
]
郭文娟
[2
]
谢维信
[3
]
高新波
[1
]
机构:
[1] 西安电子科技大学电子工程学院
[2] 陕西师范大学计算机科学学院
[3] 深圳大学信息工程学院
关键词:
RPCL;
K-means;
密度;
聚类数目;
初始聚类中心;
D O I:
10.16152/j.cnki.xdxbzr.2012.04.008
中图分类号:
TP301.6 [算法理论];
学科分类号:
081202 ;
摘要:
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。
引用
收藏
页码:570 / 576
页数:7
相关论文