文档聚类综述

被引:64
作者
刘远超
王晓龙
徐志明
关毅
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
计算机应用; 中文信息处理; 综述; 文档聚类; 降维; 概念相关; 聚类算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。
引用
收藏
页码:55 / 62
页数:8
相关论文
共 9 条
  • [1] 基于k-means聚类的无导词义消歧
    陈浩
    何婷婷
    姬东鸿
    [J]. 中文信息学报, 2005, (04) : 10 - 16
  • [2] 一种基于参考点和密度的快速聚类算法
    马帅
    王腾蛟
    唐世渭
    杨冬青
    高军
    [J]. 软件学报, 2003, (06) : 1089 - 1095
  • [3] 基于主题的Web文档聚类研究
    孙学刚
    陈群秀
    马亮
    [J]. 中文信息学报, 2003, (03) : 21 - 26
  • [4] 基于免疫规划的K-means聚类算法
    行小帅
    潘进
    焦李成
    [J]. 计算机学报, 2003, (05) : 605 - 610
  • [5] 一种基于群体智能的Web文档聚类算法
    吴斌
    傅伟鹏
    郑毅
    刘少辉
    史忠植
    [J]. 计算机研究与发展, 2002, (11) : 1429 - 1435
  • [6] 基于聚类的文本过滤模型
    林鸿飞
    马雅彬
    [J]. 大连理工大学学报, 2002, (02) : 249 - 252
  • [7] 数据分析[M]. 科学出版社 , 范金城, 2002
  • [8] 知识发现[M]. 清华大学出版社 , 史忠植著, 2002
  • [9] SELF-ORGANIZED FORMATION OF TOPOLOGICALLY CORRECT FEATURE MAPS
    KOHONEN, T
    [J]. BIOLOGICAL CYBERNETICS, 1982, 43 (01) : 59 - 69