结合双粒子群和K-means的混合文本聚类算法

被引:26
作者
王永贵
林琳
刘宪国
机构
[1] 辽宁工程技术大学软件学院
关键词
双粒子群; 自调整惯性权值; 信息交流; K-means算法; 文本聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
传统K-means算法对初始聚类中心选择较敏感,结果有可能收敛于一般次优解,为些提出一种结合双粒子群和K-means的混合文本聚类算法。设计了自调整惯性权值策略,根据最优适应度值的变化率动态调整惯性权值。两子群分别采用基于不同惯性权值策略的粒子群算法进化,子代间及子代与父代信息交流,共享最优粒子,替换最劣粒子,完成进化,该算法命名为双粒子群算法。将能平衡全局与局部搜索能力的双粒子群算法与高效的K-means算法结合,每个粒子是一组聚类中心,类内离散度之和的倒数是适应度函数,用K-means算法优化新生粒子,即为结合双粒子群和K-means的混合文本聚类算法。实验结果表明,该算法相对于K-means、PSO等文本聚类算法具有更强鲁棒性,聚类效果也有明显的改善。
引用
收藏
页码:364 / 368
页数:5
相关论文
共 10 条
[1]
Exploiting noun phrases and semantic relationships for text document clustering [J].
Zheng, Hai-Tao ;
Kang, Bo-Yeong ;
Kim, Hong-Gee .
INFORMATION SCIENCES, 2009, 179 (13) :2249-2262
[2]
Harmony K-means algorithm for document clustering [J].
Mahdavi, Mehrdad ;
Abolhassani, Hassan .
DATA MINING AND KNOWLEDGE DISCOVERY, 2009, 18 (03) :370-391
[3]
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
[4]
一种结合主动学习的半监督文档聚类算法 [J].
赵卫中 ;
马慧芳 ;
李志清 ;
史忠植 .
软件学报, 2012, 23 (06) :1486-1499
[5]
基于样本空间分布密度的初始聚类中心优化K-均值算法 [J].
谢娟英 ;
郭文娟 ;
谢维信 ;
高新波 .
计算机应用研究, 2012, 29 (03) :888-892
[6]
基于Sigmoid惯性权重自适应调整的粒子群优化算法 [J].
黄利 ;
杜伟伟 ;
丁立新 .
计算机应用研究, 2012, 29 (01) :32-34
[7]
解决文本聚类集成问题的两个谱算法.[J].徐森;卢志茂;顾国昌;.自动化学报.2009, 07
[8]
基于改进K-means聚类和霍夫变换的稀疏源混合矩阵盲估计算法 [J].
付宁 ;
乔立岩 ;
彭喜元 .
电子学报, 2009, 37(S1) (S1) :92-96
[9]
一种优化初始中心点的K-means算法 [J].
汪中 ;
刘贵全 ;
陈恩红 .
模式识别与人工智能, 2009, 22 (02) :299-304
[10]
一种基于K-Means局部最优性的高效聚类算法 [J].
雷小锋 ;
谢昆青 ;
林帆 ;
夏征义 .
软件学报, 2008, (07) :1683-1692