共 3 条
基于可变染色体长度的遗传K均值聚类算法
被引:7
作者:
严宇平
[1
]
肖菁
[2
]
机构:
[1] 中山大学软件学院
[2] 中山大学广东省信息安全技术重点实验室
来源:
关键词:
文本聚类;
K-均值算法;
遗传算法;
可变染色体长度编码;
Reuters数据集;
D O I:
10.16208/j.issn1000-7024.2008.14.077
中图分类号:
TP18 [人工智能理论];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进。该算法可以在事先不确定K值的情况下,通过多次的选择、交叉、变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集。通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法。
引用
收藏
页码:3709 / 3713
页数:5
相关论文