支持向量机组合分类及其在文本分类中的应用

被引:7
作者
赵晖
荣莉莉
机构
[1] 大连理工大学系统工程研究所
关键词
双重加权支持向量机; 近似支持向量机; 野值点识别; 自动文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对标准支持向量机对野值点和噪音敏感,分类时明显倾向于大类别的问题,提出了一种同时考虑样本差异和类别差 异的双重加权支持向量机,并给出了由近似支持向量机结合支持向量识别算法,识别野值点和计算样本重要性权值的方法.双 重加权支持向量机和近似支持向量机组合的新分类算法尤其适用于样本规模大、样本质量不一、类别不平衡的文本分类问题. 实验表明新算法改善了分类器的泛化性能,比传统方法具有更高的查准率和查全率.
引用
收藏
页码:1816 / 1820
页数:5
相关论文
共 2 条
[1]   二次损失函数支持向量机性能的研究 [J].
朱永生 ;
王成栋 ;
张优云 .
计算机学报, 2003, (08) :982-989
[2]   A tutorial on Support Vector Machines for pattern recognition [J].
Burges, CJC .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (02) :121-167