基于LSA和SVM的文本分类模型的研究

被引：9

作者：

王永智

滕至阳

王鹏

聂江涛

机构：

[1] 东南大学计算机科学与工程学院

来源：

计算机工程与设计 | 2009年 / 30卷 / 03期

关键词：

文本分类; 潜在语义分析; 支持向量机; 特征抽取; 一对一分类法;

D O I：

10.16208/j.issn1000-7024.2009.03.053

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

为了提高文本分类的准确性,研究并设计了一个基于潜在语义分析和支持向量机的多类文本分类模型。利用潜在语义分析进行特征抽取,消除多义词和同义词在文本表示时造成的偏差,并实现文本向量的降维。使用具有良好分类精度和泛化能力的支持向量机进行分类,提出一种改进的一对一多类分类算法,改善不可分问题。实验结果表明,该模型在类别数目较少时具有较好的分类效果。

引用

页码：729 / 731+734 +734

页数：4

共 13 条

[1] 基于LSA降维的KNN文本分类算法
李良俊
张斌
杨明
[J]. 东北师大学报(自然科学版), 2007, (02) : 33 - 36
[2] 基于SVM的中文网页分类方法的研究
牛强
王志晓
陈岱
夏士雄
[J]. 计算机工程与设计, 2007, (08) : 1893 - 1895
[3] 基于潜在语义分析的汉语问答系统答案提取
余正涛
樊孝忠
郭剑毅
耿增民
[J]. 计算机学报, 2006, (10) : 1889 - 1893
[4] 支持向量机在模式识别中的核函数特性分析
李盼池
许少华
[J]. 计算机工程与设计, 2005, (02) : 302 - 304
[5] 潜在语义分析在中文信息处理中的应用
刘云峰
齐欢
代建民
不详
[J]. 计算机工程与应用 , 2005, (03) : 91 - 93
[6] 潜在语义分析理论及其应用
盖杰
王怡
武港山
[J]. 计算机应用研究, 2004, (03) : 9 - 12+20
[7] 支持向量机在多类分类问题中的推广
刘志刚
李德仁
秦前清
史文中
[J]. 计算机工程与应用, 2004, (07) : 10 - 13+65
[8] 基于FSVM的雷达多目标识别
郑春红
郑贵文
焦李成
[J]. 系统工程与电子技术, 2003, (11) : 1358 - 1361
[9] 关于统计学习理论与支持向量机
张学工
[J]. 自动化学报, 2000, (01) : 36 - 46
[10] 数据挖掘中的新方法[M]. - 科学出版社 , 邓乃扬, 2004

← 1 2 →