聚类中心初始化的新方法

被引:22
作者
李春生 [1 ,2 ]
王耀南 [2 ]
机构
[1] 广东商学院数学与计算科学学院
[2] 湖南大学电气与信息工程学院
关键词
最小支撑树; 聚类中心初始化; k-means算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
k-均值聚类算法易受初始聚类中心的影响而陷入局部最优解.现有聚类中心初始化方法尚未得到广泛认可.本文依据每个类内至少有一个数据稠密区,且处于不同类的数据稠密区比处于同一类的数据稠密区相距更远的假设,在数据集合上构造一棵最小支撑树,应用根树原理在其上搜索数据稠密区并估计其密度,从中选出密度大且足够分离的数据稠密区,以其内的点作为初始聚类中心,得到了一个聚类中心初始化的新方法.将此方法与现有的方法进行比较,仿真实验表明,本文方法性能更优越.
引用
收藏
页码:1435 / 1440
页数:6
相关论文
共 4 条
[1]   基于微粒群优化聚类数目的K-均值算法 [J].
巩敦卫 ;
蒋余庆 ;
张勇 ;
周勇 .
控制理论与应用, 2009, 26 (10) :1175-1179
[2]   基于聚类和支持向量机的非线性时间序列故障预报 [J].
张军峰 ;
胡寿松 .
控制理论与应用, 2007, (01) :64-68
[3]  
Initializing K-means Batch Clustering: A Critical Evaluation of Several Techniques[J] . Douglas Steinley,Michael J. Brusco.Journal of Classification . 2006 (1)
[4]   An empirical comparison of four initialization methods for the K-Means algorithm [J].
Peña, JM ;
Lozano, JA ;
Larrañaga, P .
PATTERN RECOGNITION LETTERS, 1999, 20 (10) :1027-1040