基于LSA和SVM的文本分类模型的研究

被引:9
作者
王永智
滕至阳
王鹏
聂江涛
机构
[1] 东南大学计算机科学与工程学院
关键词
文本分类; 潜在语义分析; 支持向量机; 特征抽取; 一对一分类法;
D O I
10.16208/j.issn1000-7024.2009.03.053
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
为了提高文本分类的准确性,研究并设计了一个基于潜在语义分析和支持向量机的多类文本分类模型。利用潜在语义分析进行特征抽取,消除多义词和同义词在文本表示时造成的偏差,并实现文本向量的降维。使用具有良好分类精度和泛化能力的支持向量机进行分类,提出一种改进的一对一多类分类算法,改善不可分问题。实验结果表明,该模型在类别数目较少时具有较好的分类效果。
引用
收藏
页码:729 / 731+734 +734
页数:4
相关论文
共 13 条