结合双粒子群和K-means的混合文本聚类算法

被引：26

作者：

王永贵

林琳

刘宪国

机构：

[1] 辽宁工程技术大学软件学院

来源：

计算机应用研究 | 2014年 / 31卷 / 02期

关键词：

双粒子群; 自调整惯性权值; 信息交流; K-means算法; 文本聚类;

D O I：

暂无

中图分类号：

TP18 [人工智能理论]; TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文]; 140502 [人工智能];

摘要：

传统K-means算法对初始聚类中心选择较敏感,结果有可能收敛于一般次优解,为些提出一种结合双粒子群和K-means的混合文本聚类算法。设计了自调整惯性权值策略,根据最优适应度值的变化率动态调整惯性权值。两子群分别采用基于不同惯性权值策略的粒子群算法进化,子代间及子代与父代信息交流,共享最优粒子,替换最劣粒子,完成进化,该算法命名为双粒子群算法。将能平衡全局与局部搜索能力的双粒子群算法与高效的K-means算法结合,每个粒子是一组聚类中心,类内离散度之和的倒数是适应度函数,用K-means算法优化新生粒子,即为结合双粒子群和K-means的混合文本聚类算法。实验结果表明,该算法相对于K-means、PSO等文本聚类算法具有更强鲁棒性,聚类效果也有明显的改善。

引用

页码：364 / 368

页数：5

共 10 条

[1]

Exploiting noun phrases and semantic relationships for text document clustering [J].