共 14 条
文本聚类中文本表示和相似度计算研究综述
被引:22
作者:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

郑彦宁
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学技术信息研究所 南京大学信息管理系

潘云涛
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学技术信息研究所 南京大学信息管理系
机构:
[1] 南京大学信息管理系
[2] 中国科学技术信息研究所
来源:
关键词:
文本聚类;
文本表示;
相似度计算;
D O I:
10.13833/j.cnki.is.2012.04.012
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模型的相似度计算,基于短语的相似度计算方法和基于本体的相似度计算方法。
引用
收藏
页码:622 / 627
页数:6
相关论文
共 14 条
- [1] 一种基于本体的文本聚类方法[J]. 吉林大学学报(理学版), 2010, 48 (02) : 277 - 283朱会峰论文数: 0 引用数: 0 h-index: 0机构: 吉林大学计算机科学与技术学院左万利论文数: 0 引用数: 0 h-index: 0机构: 吉林大学计算机科学与技术学院论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:纪文彦论文数: 0 引用数: 0 h-index: 0机构: 吉林大学计算机科学与技术学院
- [2] 基于加权的本体相似度计算方法[J]. 计算机工程与设计, 2010, 31 (05) : 1093 - 1095+1103论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [3] 改进的概念语义相似度计算[J]. 计算机工程与设计, 2010, 31 (05) : 1121 - 1124论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [4] 基于本体的语义相似度计算方法研究综述[J]. 现代图书情报技术, 2010, (01) : 51 - 56论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [5] 一种改进的基于广义后缀树的文本聚类算法[J]. 信息与控制, 2009, 38 (03) : 331 - 336论文数: 引用数: h-index:机构:夏克文论文数: 0 引用数: 0 h-index: 0机构: 河北工业大学信息工程学院刘南平论文数: 0 引用数: 0 h-index: 0机构: 河北工业大学信息工程学院论文数: 引用数: h-index:机构:
- [6] 基于本体的Web页面聚类研究[J]. 计算机科学, 2008, (09) : 153 - 155论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [7] 基于向量空间模型的文本聚类算法[J]. 计算机工程, 2008, (18) : 39 - 41+44论文数: 引用数: h-index:机构:刘功申论文数: 0 引用数: 0 h-index: 0机构: 上海交通大学信息安全工程学院论文数: 引用数: h-index:机构:
- [8] 一种基于后缀树的中文网页层次聚类方法[J]. 辽宁工程技术大学学报, 2006, (06) : 890 - 892史庆伟论文数: 0 引用数: 0 h-index: 0机构: 天津大学计算机学院 天津大学计算机学院赵政论文数: 0 引用数: 0 h-index: 0机构: 天津大学计算机学院 天津大学计算机学院论文数: 引用数: h-index:机构:
- [9] 使用本体语义提高文本聚类(英文)[J]. Journal of Southeast University(English Edition), 2006, (03) : 370 - 374论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:袁福宇论文数: 0 引用数: 0 h-index: 0机构: 吉林大学计算机科学与技术学院 吉林大学计算机科学与技术学院张靖波论文数: 0 引用数: 0 h-index: 0机构: 东北师范大学计算机学院 吉林大学计算机科学与技术学院论文数: 引用数: h-index:机构:
- [10] 一种新的相似度标准及其相关的聚类算法[J]. 复旦学报(自然科学版), 2006, (02) : 177 - 184论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构: