学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
文本聚类算法的质量评价
被引:7
作者
:
刘务华
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
刘务华
罗铁坚
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
罗铁坚
王文杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
王文杰
机构
:
[1]
中国科学院研究生院
来源
:
中国科学院研究生院学报
|
2006年
/ 05期
关键词
:
文本聚类;
质量评价;
有效性验证;
后缀树聚类;
Ant-Based聚类;
k-Means聚类;
D O I
:
暂无
中图分类号
:
TP181 [自动推理、机器学习];
学科分类号
:
摘要
:
利用标准的分类测试集合进行聚类质量的量化评价,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比.实验结果分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量.
引用
收藏
页码:640 / 646
页数:7
相关论文
共 2 条
[1]
On Clustering Validation Techniques[J] . Maria Halkidi,Yannis Batistakis,Michalis Vazirgiannis.J. Intell. Inf. Syst. . 2001 (2-3)
[2]
群体智能的研究及其在知识发现中的应用. 吴斌. 中国科学院计算技术研究所 . 2002
←
1
→
共 2 条
[1]
On Clustering Validation Techniques[J] . Maria Halkidi,Yannis Batistakis,Michalis Vazirgiannis.J. Intell. Inf. Syst. . 2001 (2-3)
[2]
群体智能的研究及其在知识发现中的应用. 吴斌. 中国科学院计算技术研究所 . 2002
←
1
→