基于初始中心优化的遗传K-means聚类新算法

被引:16
作者
孙秀娟 [1 ]
刘希玉 [2 ]
机构
[1] 山东师范大学信息科学与工程学院
[2] 山东师范大学管理学院
关键词
聚类; K-means算法; 遗传算法;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。
引用
收藏
页码:166 / 168+182 +182
页数:4
相关论文
共 7 条
[1]   K-MEANS算法中的K值优化问题研究 [J].
杨善林 ;
李永森 ;
胡笑旋 ;
潘若愚 .
系统工程理论与实践, 2006, (02) :97-101
[2]   基于佳点集遗传算法的聚类技术 [J].
苏守宝 ;
刘仁金 .
计算机应用, 2005, (03) :643-645
[3]   基于遗传算法的聚类分析 [J].
傅景广 ;
许刚 ;
王裕国 .
计算机工程, 2004, (04) :122-124
[4]   用遗传算法改进聚类分析中的K-平均算法 [J].
唐立新 ;
杨自厚 ;
王梦光 .
数理统计与应用概率, 1997, (04) :58-64
[5]  
数据挖掘原理与算法[M]. 清华大学出版社 , 毛国君等编著, 2005
[6]  
知识发现[M]. 清华大学出版社 , 史忠植著, 2002
[7]  
An evolutionary technique based on K-Means algorithm for optimal clustering in R N[J] . Sanghamitra Bandyopadhyay,Ujjwal Maulik.Information Sciences . 2002 (1)