基于可变染色体长度的遗传K均值聚类算法

被引:7
作者
严宇平 [1 ]
肖菁 [2 ]
机构
[1] 中山大学软件学院
[2] 中山大学广东省信息安全技术重点实验室
关键词
文本聚类; K-均值算法; 遗传算法; 可变染色体长度编码; Reuters数据集;
D O I
10.16208/j.issn1000-7024.2008.14.077
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进。该算法可以在事先不确定K值的情况下,通过多次的选择、交叉、变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集。通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法。
引用
收藏
页码:3709 / 3713
页数:5
相关论文
共 3 条
[1]   基于遗传算法的聚类分析 [J].
傅景广 ;
许刚 ;
王裕国 .
计算机工程, 2004, (04) :122-124
[2]   使用遗传算法实现K-means聚类算法的K值选择 [J].
杨芳 ;
湛燕 ;
田学东 ;
郭宝兰 .
微机发展, 2003, (01) :25-26+29
[3]   Dynamic clustering using particle swarm optimization with application in image segmentation [J].
Omran, MGH ;
Salman, A ;
Engelbrecht, AP .
PATTERN ANALYSIS AND APPLICATIONS, 2006, 8 (04) :332-344