基于SVM的文本分类系统设计与实现

被引：4

作者：

陈子昕

机构：

[1] 东莞理工学院城市学院

来源：

东莞理工学院学报 | 2008年 / 03期

关键词：

文本分类; 分类算法; 特征提取; 词义扩展; 向量空间模型;

D O I：

10.16002/j.cnki.10090312.2008.03.023

中图分类号：

TP311.52 [];

学科分类号：

摘要：

文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程.阐述了一个文本分类系统的设计和实现.对文本分类系统的系统结构、预处理、特征提取、词义扩展、学习和识别过程、分类算法等进行了详细介绍.引入smooth技术改进词语权重,介绍向量空间模型.结果表明查全率和准确率均达到80%左右,而且smooth的引入有效地改善了分类性能.

引用

页码：38 / 43

页数：6

共 5 条

[1] Web文本挖掘三种技术的比较 [J].