一种改进的支持向量机文本分类方法

被引:24
作者
李琼
陈利
机构
[1] 汉口学院计算机科学与技术学院
关键词
文本分类; 支持向量机; 二叉树; Mercer核;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了解决传统的支持向量机(SVM)多类分类方法中普遍存在的训练和测试时间过长、实际样本输入空间非线性可分等问题,提出了一种改进的支持向量机多类分类方法。首先,利用Mercer核函数把实际输入样本向量空间中呈非线性可分分布的样本向量映射到一个高维的特征向量空间,以实现线性可分;然后,采用二叉树来创建高维特征空间中的SVM多类分类器,实现分类识别;最后,将该方法应用到网络文本分类中。实验结果表明,该方法较好地解决了多类文本分类中实际输入文本向量呈非线性可分的问题,降低了训练和测试过程中的时间消耗,且在一定程度上提高了多类文本分类的识别准确率。
引用
收藏
页码:78 / 82
页数:5
相关论文
共 12 条
[1]  
统计学习理论.[M].(美)瓦普尼克(VladimirN.Vapnik)著;许建华;张学工译;.电子工业出版社.2004,
[2]  
模式识别.[M].边肇祺等编著;.清华大学出版社.2000,
[3]  
Learning using privileged information: SVM+ and weighted SVM.[J].Maksim Lapin;Matthias Hein;Bernt Schiele.Neural Networks.2014,
[4]  
A unified SVM framework for signal estimation.[J].José Luis Rojo-Álvarez;Manel Martínez-Ramón;Jordi Muñoz-Marí;Gustavo Camps-Valls.Digital Signal Processing.2014,
[5]   Integrating a statistical background-foreground extraction algorithm and SVM classifier for pedestrian detection and tracking [J].
Li, Dawei ;
Xu, Lihong ;
Goodman, Erik D. ;
Xu, Yuan ;
Wu, Yang .
INTEGRATED COMPUTER-AIDED ENGINEERING, 2013, 20 (03) :201-216
[6]  
Study and evaluation of a multi-class SVM classifier using diminishing learning technique.[J].J. Manikandan;B. Venkataramani.Neurocomputing.2010, 10
[7]   基于类间可分性DAG-SVM的文本分类 [J].
黄振龙 ;
郑骏 ;
胡文心 .
华东师范大学学报(自然科学版), 2013, (03) :209-218
[8]   基于SVM算法的文本分类技术研究 [J].
崔建明 ;
刘建明 ;
廖周宇 .
计算机仿真, 2013, 30 (02) :299-302+368
[9]   支持向量机在文本分类中的应用 [J].
段莹 .
计算机与数字工程, 2012, 40 (07) :87-88+149
[10]   文本分类中特征预抽取方法研究 [J].
郑伟 ;
吕建新 ;
张建伟 .
情报科学 , 2011, (01) :86-88+92