基于距离排序的快速支持向量机分类算法

被引:8
作者
胡志军
王鸿斌
张惠斌
机构
[1] 忻州师范学院计算机系
关键词
支持向量机; 时空复杂度; 大规模数据; 距离排序;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP301.6 [算法理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081202 ;
摘要
传统支持向量机算法由于时空复杂度较高,因此很难有效地处理大规模数据。为了降低支持向量机算法的时空复杂度,提出一种基于距离排序的快速支持向量机分类算法。该算法首先计算两类样本点的样本中心,然后对每一个样本计算它与另一类样本中心之间的距离,最后根据距离排序选择一定比例的小距离样本作为边界样本。由于边界样本集合很好地包含了支持向量,而且数目较原始样本集合少得多,因此算法可以在保证支持向量机学习精度的前提下,有效地缩短训练时间和节约存储空间。在UCI标准数据集和20-Newsgroups文本分类数据集上的实验说明算法较以往支持向量预选取算法而言可以更为快速准确地进行支持向量预选取。
引用
收藏
页码:85 / 87+100 +100
页数:4
相关论文
共 12 条
[1]  
A comparison on methods for multi-class support vectormachines. Hsu C W,Lin C J. IEEE Transactions on Neural Networks . 2001
[2]  
A study of cross-validation and bootstrap for accuracy estimation and model selection. Kohavi R. Proceedings of the Fourteenth Internation- al Joint Conference on Artificial Intelligence . 1995
[3]  
NewsWeeder: learning to filter netnews. Lang K. Proceedings of the Twelfth International Conference on Machine Learning . 1995
[4]  
Pattern selection for support vector classifiers. Shin H,Cho S. Proc.of the3rd International Conference on Intelligent Data Engineer-ing and Automated Learning .
[5]  
An improved training algorithm for sup-port vector machines. Osuna E,Freund R,Girosi F. IEEE Workshop on Neural Networks for Signal Processing .
[6]   基于向量投影的支撑向量预选取 [J].
李青 ;
焦李成 ;
周伟达 .
计算机学报, 2005, (02) :145-152
[7]   对多层前向神经网络研究的进一步看法 [J].
阎平凡 .
电子学报, 1999, (05) :83-86
[8]   SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297
[9]  
Fast training of support vector machines using sequential minimal optimization. Platt J C. Advances in Kernel Methods-Support Vector Learning . 1999
[10]  
UCI repository of machine learning databases. Blake C,Keogh E,Merz CJ. http://www.ics.uci.edu/~mlearn/MLRepository.html . 1998