基于加权近似支持向量机的文本分类研究

被引:10
作者
杨霞
宋顺林
机构
[1] 江苏大学计算机学院
关键词
分类; 近似支持向量机; 加权近似支持向量机; 非均衡数据; 权值;
D O I
10.16208/j.issn1000-7024.2009.15.038
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文本分类能够很好地帮助用户整理、获取信息,在提高信息检索的速度和准确率方面显得意义重大,具有很重要的研究价值。针对以往的近似支持向量机没有考虑不均衡数据的情况,提出了通过对每个训练错误赋予一个权值来改进近似支持向量机,并给出了一种简单的参数估计方法。实验结果表明,基于加权近似支持向量机的分类算法在处理不均衡数据时,样本数少的类别分类精度得到提高,性能表现良好。
引用
收藏
页码:3594 / 3596
页数:3
相关论文
共 5 条
[1]
数据挖掘中的新方法.[M].邓乃扬;田英杰著;.科学出版社.2004,
[2]
文本分类及其相关技术研究 [D]. 
李荣陆 .
复旦大学,
2005
[3]
基于加权近似支持向量机的文本分类 [J].
庄东 ;
陈英 .
清华大学学报(自然科学版), 2005, (自然科学版) :1787-1790
[4]
支持向量机解决多分类问题研究 [J].
郑勇涛 ;
刘玉树 ;
不详 .
计算机工程与应用 , 2005, (23) :190-192
[5]
可补偿类别差异的加权支持向量机算法 [J].
范昕炜 ;
杜树新 ;
吴铁军 .
中国图象图形学报, 2003, (09)