学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
文本聚类技术的有效性验证
被引:5
作者
:
刘务华
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
刘务华
罗铁坚
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
罗铁坚
王文杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
王文杰
机构
:
[1]
中国科学院研究生院
来源
:
计算机工程
|
2007年
/ 01期
关键词
:
文本聚类;
聚类有效性验证;
后缀树聚类;
Ant-based;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。实验表明,STC聚类算法在处理文本时充分考虑了文本的特性,其聚类效果较好;基于Ant的聚类算法在聚类的划分时效果受参数输入的影响较大,其聚类结果与STC相比并不具有优势;在Ant聚类算法中引入文本特性后,可以提高文本聚类的效果。
引用
收藏
页码:209 / 211
页数:3
相关论文
共 1 条
[1]
On Clustering Validation Techniques[J] . Maria Halkidi,Yannis Batistakis,Michalis Vazirgiannis.J. Intell. Inf. Syst. . 2001 (2-3)
←
1
→
共 1 条
[1]
On Clustering Validation Techniques[J] . Maria Halkidi,Yannis Batistakis,Michalis Vazirgiannis.J. Intell. Inf. Syst. . 2001 (2-3)
←
1
→