基于混合聚类的中文词聚类

被引:4
作者
史金成
程转流
机构
[1] 铜陵学院数学与计算机科学系
关键词
词聚类; 层次聚类; 概念聚类; 混合聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本聚类在文本挖掘和信息检索系统中发挥着重要的作用,而词聚类是文本聚类的基础。提出了一种基于混合聚类的中文词聚类方法,它将层次聚类和概念聚类结合起来,以缩短整个聚类时间。首先对预处理后的词集进行初始聚类,然后从每个类中各取一个出现次数最多的词组成新的词集,最后对该词集进行再聚类。实验表明,这种方法有效降低了中文词聚类的时间复杂度。
引用
收藏
页码:222 / 223
页数:2
相关论文
共 3 条
  • [1] 文档聚类综述
    刘远超
    王晓龙
    徐志明
    关毅
    [J]. 中文信息学报, 2006, (03) : 55 - 62
  • [2] 聚类算法研究
    孙吉贵
    刘杰
    赵连宇
    [J]. 软件学报, 2008, (01) : 48 - 61
  • [3] 用于文本分类和文本聚类的特征抽取方法的研究
    孟春艳
    [J]. 微计算机信息, 2009, 25 (09) : 149 - 150