文本聚类技术的有效性验证

被引:5
作者
刘务华
罗铁坚
王文杰
机构
[1] 中国科学院研究生院
关键词
文本聚类; 聚类有效性验证; 后缀树聚类; Ant-based;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。实验表明,STC聚类算法在处理文本时充分考虑了文本的特性,其聚类效果较好;基于Ant的聚类算法在聚类的划分时效果受参数输入的影响较大,其聚类结果与STC相比并不具有优势;在Ant聚类算法中引入文本特性后,可以提高文本聚类的效果。
引用
收藏
页码:209 / 211
页数:3
相关论文
共 1 条
[1]  
On Clustering Validation Techniques[J] . Maria Halkidi,Yannis Batistakis,Michalis Vazirgiannis.J. Intell. Inf. Syst. . 2001 (2-3)