一种基于自动阈值发现的文本聚类方法

被引:17
作者
张猛
王大玲
于戈
机构
[1] 东北大学信息科学与工程学院
关键词
文本聚类; 细化簇; 自动阈值发现;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本聚类随着网上文本的激增以及实际应用中的需求 ,引起了人们越来越多的重视 通过分析文本的特征以及常用的文本聚类方法 ,提出了一种对文本进行细致划分获取细化簇、并在细化簇基础上进行聚类的文本聚类方法 在聚类过程中 ,采用曲线的多项式拟合技术提出了一种自动发现阈值的方法 ,并把该方法应用于细化簇的寻找步骤中 与凝聚的层次聚类方法的实验比较结果表明 ,使用自动阈值发现的方法在时间消耗、聚类效果、以及对孤立点的容忍性方面都具有更优的性能
引用
收藏
页码:1748 / 1753
页数:6
相关论文
共 1 条
  • [1] 基于Web-Log Mining的Web文档聚类
    苏中
    马少平
    杨强
    张宏江
    [J]. 软件学报, 2002, (01) : 99 - 104