学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于LSA和SVM的文本分类模型的研究
被引:9
作者
:
论文数:
引用数:
h-index:
机构:
王永智
论文数:
引用数:
h-index:
机构:
滕至阳
论文数:
引用数:
h-index:
机构:
王鹏
论文数:
引用数:
h-index:
机构:
聂江涛
机构
:
[1]
东南大学计算机科学与工程学院
来源
:
计算机工程与设计
|
2009年
/ 30卷
/ 03期
关键词
:
文本分类;
潜在语义分析;
支持向量机;
特征抽取;
一对一分类法;
D O I
:
10.16208/j.issn1000-7024.2009.03.053
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
为了提高文本分类的准确性,研究并设计了一个基于潜在语义分析和支持向量机的多类文本分类模型。利用潜在语义分析进行特征抽取,消除多义词和同义词在文本表示时造成的偏差,并实现文本向量的降维。使用具有良好分类精度和泛化能力的支持向量机进行分类,提出一种改进的一对一多类分类算法,改善不可分问题。实验结果表明,该模型在类别数目较少时具有较好的分类效果。
引用
收藏
页码:729 / 731+734 +734
页数:4
相关论文
共 13 条
[1]
基于LSA降维的KNN文本分类算法
论文数:
引用数:
h-index:
机构:
李良俊
张斌
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院
东北大学信息科学与工程学院
张斌
论文数:
引用数:
h-index:
机构:
杨明
[J].
东北师大学报(自然科学版),
2007,
(02)
: 33
-
36
[2]
基于SVM的中文网页分类方法的研究
牛强
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学计算机科学与技术学院
牛强
王志晓
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学计算机科学与技术学院
王志晓
论文数:
引用数:
h-index:
机构:
陈岱
论文数:
引用数:
h-index:
机构:
夏士雄
[J].
计算机工程与设计,
2007,
(08)
: 1893
-
1895
[3]
基于潜在语义分析的汉语问答系统答案提取
论文数:
引用数:
h-index:
机构:
余正涛
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学工程系
昆明理工大学信息工程与自动化学院
樊孝忠
论文数:
引用数:
h-index:
机构:
郭剑毅
论文数:
引用数:
h-index:
机构:
耿增民
[J].
计算机学报,
2006,
(10)
: 1889
-
1893
[4]
支持向量机在模式识别中的核函数特性分析
李盼池
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
李盼池
许少华
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
许少华
[J].
计算机工程与设计,
2005,
(02)
: 302
-
304
[5]
潜在语义分析在中文信息处理中的应用
刘云峰
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
刘云峰
齐欢
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
齐欢
代建民
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
代建民
不详
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
不详
[J].
计算机工程与应用 ,
2005,
(03)
: 91
-
93
[6]
潜在语义分析理论及其应用
盖杰
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
盖杰
王怡
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
王怡
武港山
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
武港山
[J].
计算机应用研究,
2004,
(03)
: 9
-
12+20
[7]
支持向量机在多类分类问题中的推广
刘志刚
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学遥感信息工程学院
刘志刚
李德仁
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学遥感信息工程学院
李德仁
论文数:
引用数:
h-index:
机构:
秦前清
论文数:
引用数:
h-index:
机构:
史文中
[J].
计算机工程与应用,
2004,
(07)
: 10
-
13+65
[8]
基于FSVM的雷达多目标识别
论文数:
引用数:
h-index:
机构:
郑春红
郑贵文
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学电子工程学院
郑贵文
论文数:
引用数:
h-index:
机构:
焦李成
[J].
系统工程与电子技术,
2003,
(11)
: 1358
-
1361
[9]
关于统计学习理论与支持向量机
张学工
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学自动化系!智能技术与系统国家重点实验室北京
张学工
[J].
自动化学报,
2000,
(01)
: 36
-
46
[10]
数据挖掘中的新方法[M]. - 科学出版社 , 邓乃扬, 2004
←
1
2
→
共 13 条
[1]
基于LSA降维的KNN文本分类算法
论文数:
引用数:
h-index:
机构:
李良俊
张斌
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院
东北大学信息科学与工程学院
张斌
论文数:
引用数:
h-index:
机构:
杨明
[J].
东北师大学报(自然科学版),
2007,
(02)
: 33
-
36
[2]
基于SVM的中文网页分类方法的研究
牛强
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学计算机科学与技术学院
牛强
王志晓
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学计算机科学与技术学院
王志晓
论文数:
引用数:
h-index:
机构:
陈岱
论文数:
引用数:
h-index:
机构:
夏士雄
[J].
计算机工程与设计,
2007,
(08)
: 1893
-
1895
[3]
基于潜在语义分析的汉语问答系统答案提取
论文数:
引用数:
h-index:
机构:
余正涛
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学工程系
昆明理工大学信息工程与自动化学院
樊孝忠
论文数:
引用数:
h-index:
机构:
郭剑毅
论文数:
引用数:
h-index:
机构:
耿增民
[J].
计算机学报,
2006,
(10)
: 1889
-
1893
[4]
支持向量机在模式识别中的核函数特性分析
李盼池
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
李盼池
许少华
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
许少华
[J].
计算机工程与设计,
2005,
(02)
: 302
-
304
[5]
潜在语义分析在中文信息处理中的应用
刘云峰
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
刘云峰
齐欢
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
齐欢
代建民
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
代建民
不详
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
不详
[J].
计算机工程与应用 ,
2005,
(03)
: 91
-
93
[6]
潜在语义分析理论及其应用
盖杰
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
盖杰
王怡
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
王怡
武港山
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
武港山
[J].
计算机应用研究,
2004,
(03)
: 9
-
12+20
[7]
支持向量机在多类分类问题中的推广
刘志刚
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学遥感信息工程学院
刘志刚
李德仁
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学遥感信息工程学院
李德仁
论文数:
引用数:
h-index:
机构:
秦前清
论文数:
引用数:
h-index:
机构:
史文中
[J].
计算机工程与应用,
2004,
(07)
: 10
-
13+65
[8]
基于FSVM的雷达多目标识别
论文数:
引用数:
h-index:
机构:
郑春红
郑贵文
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学电子工程学院
郑贵文
论文数:
引用数:
h-index:
机构:
焦李成
[J].
系统工程与电子技术,
2003,
(11)
: 1358
-
1361
[9]
关于统计学习理论与支持向量机
张学工
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学自动化系!智能技术与系统国家重点实验室北京
张学工
[J].
自动化学报,
2000,
(01)
: 36
-
46
[10]
数据挖掘中的新方法[M]. - 科学出版社 , 邓乃扬, 2004
←
1
2
→