文本聚类算法的质量评价

被引:7
作者
刘务华
罗铁坚
王文杰
机构
[1] 中国科学院研究生院
关键词
文本聚类; 质量评价; 有效性验证; 后缀树聚类; Ant-Based聚类; k-Means聚类;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
利用标准的分类测试集合进行聚类质量的量化评价,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比.实验结果分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量.
引用
收藏
页码:640 / 646
页数:7
相关论文
共 2 条
  • [1] On Clustering Validation Techniques[J] . Maria Halkidi,Yannis Batistakis,Michalis Vazirgiannis.J. Intell. Inf. Syst. . 2001 (2-3)
  • [2] 群体智能的研究及其在知识发现中的应用. 吴斌. 中国科学院计算技术研究所 . 2002