基于向量空间模型的文本自动分类系统的研究与实现

被引:16
作者
武旭
须德
不详
机构
[1] 北方交通大学计算机与信息技术学院
[2] 北方交通大学计算机与信息技术学院 北京
[3] 北京
关键词
文本分类; 向量空间模型; 特征提取;
D O I
暂无
中图分类号
TP274.3 [];
学科分类号
0804 ; 080401 ; 080402 ; 081002 ; 0835 ;
摘要
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%.
引用
收藏
页码:38 / 41
页数:4
相关论文
共 1 条
[1]   Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520