学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
VSM在中文文本聚类中的应用及实证分析
被引:41
作者
:
论文数:
引用数:
h-index:
机构:
马辉民
[
1
]
论文数:
引用数:
h-index:
机构:
李卫华
[
1
]
吴良元
论文数:
0
引用数:
0
h-index:
0
机构:
湖北省荆门利盛石化工贸有限公司
华中科技大学管理学院
吴良元
[
2
]
机构
:
[1]
华中科技大学管理学院
[2]
湖北省荆门利盛石化工贸有限公司
来源
:
武汉理工大学学报(信息与管理工程版)
|
2006年
/ 04期
关键词
:
文本聚类;
向量空间模型;
文本表示;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
文本聚类是W eb文本挖掘的一个重要分支,而文本表示方法是文本聚类的基础。重点讨论了文本表示方法中最常用到的向量空间模型,分析了其优势和不足,并基于一个文本处理实验,对V SM模型从可实现角度给出改进建议。
引用
收藏
页码:56 / 59+81 +81
页数:5
相关论文
共 2 条
[1]
数据挖掘中聚类方法比较研究[J] 牟廉明 内江师范学院学报 2003, 02
[2]
一种新的基于统计的自动文本分类方法
[J].
刘斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
刘斌
;
黄铁军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
黄铁军
;
程军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
程军
;
高文
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
高文
.
中文信息学报,
2002,
(06)
:18
-24
←
1
→
共 2 条
[1]
数据挖掘中聚类方法比较研究[J] 牟廉明 内江师范学院学报 2003, 02
[2]
一种新的基于统计的自动文本分类方法
[J].
刘斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
刘斌
;
黄铁军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
黄铁军
;
程军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
程军
;
高文
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
高文
.
中文信息学报,
2002,
(06)
:18
-24
←
1
→