基于二叉树的多分类SVM算法在电子邮件过滤中的应用

被引:13
作者
衣治安
刘杨
机构
[1] 大庆石油学院计算机与信息技术学院
关键词
二叉树; 多分类SVM; 电子邮件过滤; 聚类;
D O I
暂无
中图分类号
TP393.098 []; TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
目前性能较好的多分类算法有1-v-r支持向量机(SVM)、1-1-1SVM、DDAG SVM等,但存在大量不可分区域且训练时间较长的问题。提出一种基于二叉树的多分类SVM算法用于电子邮件的分类与过滤,通过构建二叉树将多分类转化为二值分类,算法采用先聚类再分类的思想,计算测试样本与子类中心的最大相似度和子类间的分离度,以构造决策节点的最优分类超平面。对于C类分类只需C-1个决策函数,从而可节省训练时间。实验表明,该算法得到了较高的查全率、查准率。
引用
收藏
页码:2860 / 2862
页数:3
相关论文
共 3 条
[1]
支持向量机在网页信息分类中的应用研究 [J].
刘丽珍 ;
贺海军 ;
陆玉昌 ;
宋瀚涛 .
小型微型计算机系统, 2007, (02) :337-340
[2]
基于SVM决策树判别测试点类别的新方法 [J].
薛欣 ;
贺国平 .
计算机应用, 2007, (01) :84-85
[3]
基于支持向量机的电子邮件过滤技术 [J].
胥锋 ;
薛质 ;
李建华 .
电信快报, 2006, (10) :22-26