共 5 条
一种改进的遗传k-means聚类算法
被引:22
作者:
刘婷
郭海湘
诸克军
高思维
机构:
[1] 中国地质大学管理学院
来源:
关键词:
聚类;
k-means算法;
遗传算法;
D O I:
暂无
中图分类号:
O212.1 [一般数理统计];
学科分类号:
020208 ;
070103 ;
0714 ;
摘要:
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率.
引用
收藏
页码:104 / 111
页数:8
相关论文