基于遗传算法的动态文本聚类

被引:3
作者
乐兵
王明文
机构
[1] 江西师范大学计算机信息工程学院
关键词
文本聚类; 遗传算法; 二进制编码; 欧氏距离; 纯度;
D O I
10.16357/j.cnki.issn1000-5862.2006.03.021
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
为了解决动态文本聚类中聚类中心陷于局部极值点的问题,该文提出了基于遗传算法的动态文本聚类方法.采用二进制编码方式对聚类中心进行编码、类内中的点与其类中心的欧氏距离作为适应度函数.通过遗传算子的操作对类中心进行逐步迭代,直至适应度函数收敛,得到使聚类划分效果最好的聚类中心.实验表明该方法可以克服局部极值点的问题,且聚类结果的评价指标Purity(纯度)也比较好.
引用
收藏
页码:278 / 281
页数:4
相关论文
共 4 条
[1]  
潜在语义分类模型的研究.[D].曾雪强.江西师范大学.2005, 04
[2]  
遗传算法的基本理论与应用.[M].李敏强等著;.科学出版社.2002,
[3]  
多元统计分析.[M].袁志发;周静芋主编;.科学出版社.2002,
[4]  
应用数理统计.[M].朱勇华等编;.武汉水利电力大学出版社.1999,