一种聚簇消减大规模数据的支持向量分类算法

被引:10
作者
陈光喜 [1 ]
徐健 [2 ]
成彦 [1 ]
机构
[1] 桂林电子科技大学数学与计算科学学院
[2] 安徽财经大学统计与应用数学学院
关键词
支持向量机; 聚簇集; 大规模数据集; 训练速度;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对支持向量分类机对大规模数据集训练速度慢的瓶颈,提出一种聚簇消减数据集方法。首先建立样本中心距离函数,计算聚簇集的比例半径,然后利用聚簇集镜像扫描样本点确定簇集类,同一类样本特性的聚簇集中只保留代表样本点,建立异类点删除矩阵,通过上述方法消减样本集。证明了这种簇消减算法有较低的时间复杂度,并利用实验说明了保留代表点的有效意义。最后通过随机数据和UCI标准数据库验证了算法在保证分类精度的同时提高了分类速度。
引用
收藏
页码:184 / 188
页数:5
相关论文
共 6 条
[1]  
数据挖掘中的新方法.[M].邓乃扬;田英杰著;.科学出版社.2004,
[2]   大规模数据分类的支持向量预处理方法 [J].
徐健 ;
陈光喜 .
计算机应用, 2007, (S2) :257-259
[3]   支持向量机训练算法比较研究 [J].
白亮 ;
老松杨 ;
胡艳丽 ;
不详 .
计算机工程与应用 , 2005, (17) :79-81+84
[4]   各种不同类型的支持向量机及其性能比较分析 [J].
胡懋智 ;
古红英 ;
不详 .
计算机工程与应用 , 2005, (12) :37-40
[5]   支持向量机训练和实现算法综述 [J].
王晓丹 ;
王积勤 .
计算机工程与应用, 2004, (13) :75-78+175
[6]   一种改进的支持向量机NN-SVM [J].
李红莲 ;
王春花 ;
袁保宗 .
计算机学报, 2003, (08) :1015-1020