支持向量机学习算法的若干问题研究

被引:0
作者
王磊
机构
[1] 电子科技大学
关键词
机器学习; 统计学习理论; 支持向量机; 集成学习方法; 并行学习结构; 模糊渐近式学习算法;
D O I
暂无
年度学位
2007
学位类型
博士
导师
摘要
支持向量机是建立在统计学习理论的VC维理论和结构风险最小化原则基础上的新型机器学习方法。它根据有限样本信息在模型的复杂度和期望风险之间寻求最佳折衷,能够获得更好的泛化性能。与传统的神经网络等学习方法相比,支持向量机具有泛化能力强、维数不敏感、收敛到全局最优等优点,很好地解决了前者容易出现的过学习、局部极值、维数灾难等棘手问题,因而成为近几年机器学习领域中的一个非常活跃的研究热点。 然而,支持向量机是机器学习领域中相对比较新的理论,它在很多方面尚不成熟、不完善,需要进一步地研究和改进。其中,关于它的学习算法的研究是该理论的重点和难点内容之一。本文主要从提升泛化性能、提高学习速度、探索新型学习算法、增强学习过程的健壮性以及半监督学习等几个角度,对支持向量机的学习算法进行了比较系统的研究。 论文的主要研究工作包括以下5个方面: 1.特殊设计的集成学习算法能够提高支持向量机的泛化性能。在分析不同的样本扰动方式对于增大成员分类器之间差异性的作用之后,本文提出了两种基于二重扰动机制的集成学习算法,它们的共同特点是:均采取同时对输入特征空间和模型参数进行扰动的方式来产生成员分类器,并利用多数投票方法对它们进行组合。数值实验结果表明,两种算法均能够显著提升支持向量机的泛化性能。 2.支持向量机的学习过程需要求解一个凸二次规划问题,在大样本情况下,需要的计算开销和存储开销都非常大。通过将开销分解到并行系统的多个计算节点上并行地进行处理或者通过设计并行学习算法是解决该问题的有效途径之一。本文提出了“多重三叉级联(MTC)”并行学习结构,具有反馈速度快、节点利用率高、反馈的支持向量数目多等优点;并且,基于该学习结构设计了支持向量机的并行学习算法,获得了非常高的加速比和并行效率,显著提高了学习速度。 3.支持向量机的大多数学习算法都是针对其对偶优化问题进行求解,但直接针对其原始优化问题进行求解也是非常可行的。本文利用Huber函数消除原始优化目标函数中的ι1范数后,推导得到其无约束、连续、二次可微且严格凸的γ-近似优化问题,然后采用Newton下降法进行求解,并对解的更新规则进行了推导和简化。在此基础上,提出一种能够直接在原始空间中求解支持向量机的近似最优解的快速学习算法,并对算法的收敛性、复杂度以及解的性质进行了分析。 4.支持向量机采用的Hinge损失函数对噪声样本引起的罚损失没有任何限制,这是它对噪声样本敏感的根本原因。本文提出一种基于光滑Ramp损失函数的健壮支持向量机方法,能够有效抑制噪声样本对泛化性能的影响。鉴于新方法的优化问题是非凸的,首先采用CCCP过程将其变换成一系列的无约束、二次可微且严格凸的优化问题,然后采用Newton下降法在原始空间中进行求解,并对解的更新规则进行了推导和化简。在此基础上,给出了健壮支持向量机的学习算法。 5.半监督支持向量机能够同时利用“标记”和“未标记”样本进行学习,但是,求解它的最优解是一个NP难问题。渐近式学习算法通过逐步地对少量样本进行标记,能够快速获得半监督支持向量机的近似解,但它也存在两个明显缺陷,严重影响了泛化性能。针对这些缺陷,本文提出一种模糊渐近式学习算法,它通过自适应地为样本设置模糊隶属度,消除了渐近过程对“不一致”样本优化的阻碍;并且采用新的算法停止条件,使得“未标记”样本中的分类信息尽量被充分利用;同时,还采用了混合训练集缩减策略,有利于提高算法的学习速度。数值实验结果表明,新算法是半监督支持向量机的一种高精度的、快速学习算法。
引用
收藏
页数:137
共 21 条
[1]
基于支持向量机的转子振动信号故障分类研究 [J].
吴峰崎 ;
孟光 .
振动工程学报, 2006, (02) :238-241
[2]
基于样本之间紧密度的模糊支持向量机方法 [J].
张翔 ;
肖小玲 ;
徐光祐 .
软件学报, 2006, (05) :951-958
[3]
基于向量投影的支撑向量预选取 [J].
李青 ;
焦李成 ;
周伟达 .
计算机学报, 2005, (02) :145-152
[4]
模糊多类支持向量机及其在入侵检测中的应用 [J].
李昆仑 ;
黄厚宽 ;
田盛丰 ;
刘振鹏 ;
刘志强 .
计算机学报, 2005, (02) :274-280
[5]
支持向量机推广能力估计方法比较 [J].
董春曦 ;
杨绍全 ;
饶鲜 ;
汤建龙 .
电路与系统学报, 2004, (04) :86-91+96
[6]
支持向量机的若干新进展 [J].
王国胜 ;
钟义信 .
电子学报, 2001, (10) :1397-1400
[7]
支撑矢量预选取的中心距离比值法 [J].
焦李成 ;
张莉 ;
周伟达 .
电子学报, 2001, (03) :383-386
[8]
An improved gradient projection-based decomposition technique for support vector machines [J].
Zanni, Luca .
COMPUTATIONAL MANAGEMENT SCIENCE, 2006, 3 (02) :131-145
[9]
Adapt bagging to nearest neighbor classifiers [J].
Zhou, ZH ;
Yu, Y .
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2005, 20 (01) :48-54
[10]
Finite Computation of the ℓ<Subscript>1</Subscript> Estimator from Huber’s <Emphasis Type="Italic">M</Emphasis>-Estimator in Linear Regression.[J].M. Ç. P⊂nar.Computing.2004, 3-4