适合大样本快速训练的最大夹角间隔核心集向量机

被引:8
作者
胡文军 [1 ,2 ]
王士同 [1 ]
邓赵红 [1 ]
机构
[1] 江南大学信息工程学院
[2] 湖州师范学院信息与工程学院
关键词
向量夹角间隔; 核化方法; 核心集向量机; 最小包络球;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
许多核化形式的分类方法如SVM,SVDD等都是对应一个二次规划(QP)问题,而核矩阵计算需要O(m2)空间复杂度,求解QP需要O(m3)时间复杂度,限制了这类方法对大样本数据的训练.本文基于一种新的分类间隔概念提出最大向量夹角间隔分类器MAMC,目标是在样本空间找到最优向量c,测试样本通过c与训练样本之间的最大化向量夹角间隔ρ(称为Margin)实现分类.同时,文中证明了该方法的核化形式等价于核化的最小包络球MEB问题,并通过引入核心集向量机CVM将MAMC扩展为MAM-CVM,进而快速实现对大样本的训练和分类.人造和真实数据集实验表明了MAMC和MAM-CVM算法的有效性.
引用
收藏
页码:1178 / 1184
页数:7
相关论文
共 5 条
[1]   基于矩阵模式的最小类内散度支持向量机 [J].
皋军 ;
王士同 .
电子学报, 2009, 37 (05) :1051-1057
[2]   Support vector data description [J].
Tax, DMJ ;
Duin, RPW .
MACHINE LEARNING, 2004, 54 (01) :45-66
[3]   A parallel mixture of SVMs for very large scale problems [J].
Collobert, R ;
Bengio, S ;
Bengio, Y .
NEURAL COMPUTATION, 2002, 14 (05) :1105-1114
[4]   New support vector algorithms [J].
Schölkopf, B ;
Smola, AJ ;
Williamson, RC ;
Bartlett, PL .
NEURAL COMPUTATION, 2000, 12 (05) :1207-1245
[5]   SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297