多项式核支持向量机文本分类器泛化性能分析

被引:16
作者
孙建涛
郭崇慧
陆玉昌
石纯一
机构
[1] 清华大学计算机科学与技术系,清华大学智能技术与系统国家重点实验室北京,北京
基金
国家自然科学基金重大项目;
关键词
支持向量机; 文本分类; 结构风险最小化;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
VC维理论和结构风险最小化准则是统计学习理论中的重要内容 ,基于这一理论的支持向量机算法由于具有好的泛化性能受到重视 ,并被研究用于文本分类问题 基于多项式核的研究工作认为SVM的泛化能力不受多项式阶数的影响 ,并且能够处理很高维的分类问题 ,用于文本分类无需进行特征选择 研究发现 ,随着多项式核阶数的升高 ,SVM文本分类器会出现过学习现象 ,并且特征数越多越明显 ,特征选择是必需的 通过估计函数集的VC维 ,基于结构风险最小化理论对此问题进行分析 ,得出的结论跟实验结果相符
引用
收藏
页码:1321 / 1326
页数:6
相关论文
共 1 条
[1]   机器学习研究 [J].
王珏 ;
石纯一 .
广西师范大学学报(自然科学版), 2003, (02) :1-15