共 1 条
多项式核支持向量机文本分类器泛化性能分析
被引:16
作者:
孙建涛
郭崇慧
陆玉昌
石纯一
机构:
[1] 清华大学计算机科学与技术系,清华大学智能技术与系统国家重点实验室北京,北京
来源:
基金:
国家自然科学基金重大项目;
关键词:
支持向量机;
文本分类;
结构风险最小化;
D O I:
暂无
中图分类号:
TP18 [人工智能理论];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
VC维理论和结构风险最小化准则是统计学习理论中的重要内容 ,基于这一理论的支持向量机算法由于具有好的泛化性能受到重视 ,并被研究用于文本分类问题 基于多项式核的研究工作认为SVM的泛化能力不受多项式阶数的影响 ,并且能够处理很高维的分类问题 ,用于文本分类无需进行特征选择 研究发现 ,随着多项式核阶数的升高 ,SVM文本分类器会出现过学习现象 ,并且特征数越多越明显 ,特征选择是必需的 通过估计函数集的VC维 ,基于结构风险最小化理论对此问题进行分析 ,得出的结论跟实验结果相符
引用
收藏
页码:1321 / 1326
页数:6
相关论文