一种改进的遗传k-means聚类算法

被引:22
作者
刘婷
郭海湘
诸克军
高思维
机构
[1] 中国地质大学管理学院
关键词
聚类; k-means算法; 遗传算法;
D O I
暂无
中图分类号
O212.1 [一般数理统计];
学科分类号
020208 ; 070103 ; 0714 ;
摘要
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率.
引用
收藏
页码:104 / 111
页数:8
相关论文
共 5 条
[1]   K-MEANS算法中的K值优化问题研究 [J].
杨善林 ;
李永森 ;
胡笑旋 ;
潘若愚 .
系统工程理论与实践, 2006, (02) :97-101
[2]   基于粒子群的K均值聚类算法 [J].
刘靖明 ;
韩丽川 ;
侯立文 .
系统工程理论与实践, 2005, (06) :54-58
[3]   基于混合遗传算法的K-Means最优聚类算法 [J].
吕强 ;
俞金寿 .
华东理工大学学报(自然科学版), 2005, (02) :219-222
[4]   基于遗传算法的聚类分析 [J].
傅景广 ;
许刚 ;
王裕国 .
计算机工程, 2004, (04) :122-124
[5]   用遗传算法改进聚类分析中的K-平均算法 [J].
唐立新 ;
杨自厚 ;
王梦光 .
数理统计与应用概率, 1997, (04) :58-64