共 1 条
基于向量空间模型的文本自动分类系统的研究与实现
被引:16
作者:
武旭
须德
不详
机构:
[1] 北方交通大学计算机与信息技术学院
[2] 北方交通大学计算机与信息技术学院 北京
[3] 北京
来源:
关键词:
文本分类;
向量空间模型;
特征提取;
D O I:
暂无
中图分类号:
TP274.3 [];
学科分类号:
0804 ;
080401 ;
080402 ;
081002 ;
0835 ;
摘要:
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%.
引用
收藏
页码:38 / 41
页数:4
相关论文