支持向量机多类分类算法研究

被引:0
作者
丁然
机构
[1] 哈尔滨理工大学
关键词
支持向量机; 不平衡数据; 多类分类; 二叉树;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
支持向量机(SVM)为一种由Vapnik等人研发出的机器学习方法,是面向小样本进行学习而提出的方法。它在统计学习理论的基础上发展而来,由于继承了其结构风险最小化准则和VC维理论,可以很好的解决训练误差过小反而导致推广能力下降的问题,提高了学习方法对未来输出进行正确预测的能力。正是支持向量机的这些优点,这种学习方法得到了众多学者的高度关注,已成为研究的重点推动着机器学习的发展。支持向量机的发展起源是解决两类分类的问题,可在实际中主要的情况是对多类加以分类,因此,如何将其推向多类处理问题成为当今一项十分重要的研究方向。 本文对支持向量机的支撑理论统计学习理论进行了关键理论的阐述,并在此基础上论述了支持向量机算法,对支持向量机的分类原理进行了论述。在明确支持向量机原理的基础上,总结了关于支持向量机多类分类方法的国内外研究成果,包涵有“一对一”、二叉树、“一对多”、决策有向无环图等多种方法。分析对比了各个方法的优点和不足,并对它们的分类性能做出总结。 通过分析各个多类分类方法,总结出了二叉树方法具有最优的多类分类性能,尤其是对于大规模多类分类问题。本文针对二叉树方法的关键性问题,即树层次结构的划分提出了改进的向量投影方法,利用此方法度量类间可分性的大小,并将易分的类放在树的上层节点中,从而减少误差累积现象对分类精度的影响。二叉树的另一个问题是某些节点处存在不平衡数据分类现象,本文利用改进的SMOTE向上采样方法对不平衡数据集进行采样。本方法不改变样本集分布特性,并且降低了因随机采样而造成的严重样本混叠。最后,将本文的各个算法在UCI数据库上进行了验证,与改进前的方法及“一对多”方法相比,本文的算法提高了分类精度,尤其是对于大规模多类分类的应用中得到了更显著的良好分类效果。
引用
收藏
页数:55
共 31 条
[1]
Lagrange双支撑向量回归机 [J].
郑逢德 ;
张鸿宾 .
计算机科学, 2011, 38 (12) :247-249+254
[2]
基于支持向量数据描述的在线签名认证系统 [J].
邹杰 ;
吴仲城 .
模式识别与人工智能, 2011, 24 (02) :284-290
[3]
支持向量机应用概述 [J].
叶磊 ;
骆兴国 .
电脑知识与技术, 2010, 6 (34) :9815-9816
[4]
基于条件正定核的SVM人脸识别 [J].
刘莉 ;
陈秀宏 ;
梁久祯 .
计算机工程与应用, 2010, 46 (33) :178-181
[5]
支持向量机的SMO算法及其自适应改进研究 [J].
王伟 ;
刘梅 ;
段爱玲 .
河南科学, 2010, 28 (04) :436-439
[6]
基于邻域粗糙集的支持向量机分类方法研究 [J].
韩虎 ;
党建武 ;
任恩恩 .
计算机科学, 2010, 37 (02) :229-231+285
[7]
核函数支持向量机 [J].
杨钟瑾 .
计算机工程与应用, 2008, (33) :1-6+24
[8]
基于K近邻的支持向量机分类方法 [J].
和文全 ;
薛惠峰 ;
解丹蕊 ;
杜喆 .
计算机仿真, 2008, (11) :161-163+171
[9]
光滑支持向量机的原理和进展 [J].
熊金志 ;
胡金莲 ;
袁华强 .
计算机工程, 2008, (13) :172-173+197
[10]
基于粗糙集与支持向量机的分类算法 [J].
邓九英 ;
杜启亮 ;
毛宗源 ;
姚琛 .
华南理工大学学报(自然科学版), 2008, (05) :123-127