基于并行遗传算法的K-means聚类研究

被引:13
作者
戴文华 [1 ]
焦翠珍 [1 ]
何婷婷 [2 ]
机构
[1] 咸宁学院计算机系
[2] 华中师范大学计算机科学系
关键词
并行遗传算法; 可变长染色体编码; K-means算法; 聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对传统K-means聚类算法对初始聚类中心的选择敏感,以及聚类数K难以确定的问题,提出一种基于并行遗传算法的K-means聚类方法。该方法采用一种新型的可变长染色体编码方案,随机选择样本点作为初始聚类中心形成染色体,然后结合K-means算法的高效性和并行遗传算法的全局优化能力,通过种群内的遗传、变异和种群间的并行进化、联姻,有效地避免了局部最优解的出现,同时得到了优化的聚类数目和聚类结果。实验表明该方法是一种精确高效的聚类方法。
引用
收藏
页码:171 / 174
页数:4
相关论文
共 3 条
  • [1] A new cluster validity index for the fuzzy c -mean[J] . M. Ramze Rezaee,B.P.F. Lelieveldt,J.H.C. Reiber.Pattern Recognition Letters . 1998 (3)
  • [2] A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)
  • [3] Fast and effective text mining using linear-ti me document clustering .2 Larsen B,Aone C. Proc.of the Fifth ACMSIGKDD International Conference on Knowledge Discovery and Data Mining . 1999