VSM在中文文本聚类中的应用及实证分析

被引:41
作者
马辉民 [1 ]
李卫华 [1 ]
吴良元 [2 ]
机构
[1] 华中科技大学管理学院
[2] 湖北省荆门利盛石化工贸有限公司
关键词
文本聚类; 向量空间模型; 文本表示;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文本聚类是W eb文本挖掘的一个重要分支,而文本表示方法是文本聚类的基础。重点讨论了文本表示方法中最常用到的向量空间模型,分析了其优势和不足,并基于一个文本处理实验,对V SM模型从可实现角度给出改进建议。
引用
收藏
页码:56 / 59+81 +81
页数:5
相关论文
共 2 条
[1]
数据挖掘中聚类方法比较研究[J] 牟廉明 内江师范学院学报 2003, 02
[2]
一种新的基于统计的自动文本分类方法 [J].
刘斌 ;
黄铁军 ;
程军 ;
高文 .
中文信息学报, 2002, (06) :18-24