基于二叉树多类支持向量机的文本分类研究

被引:4
作者
龙军
王易
刘高嵩
机构
[1] 中南大学信息科学与工程学院
关键词
向量空间模型; 特征表示; 特征提取; 多类支持向量机; 二叉树文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本分类是文本数据挖掘的基础和核心,为解决在文本分类中二值支持向量机不能进行多类分类的问题,论文提出采用二叉树对多个二值支持向量机(SVM)子分类器进行组合,并运用聚类分析中类距离方法规范二叉树生成过程的基于二叉树的多类支持向量机(MSVM)分类算法。实验数据表明,相对于KNN算法和朴素贝叶斯算法,基于二叉树的MSVM算法在文本分类上更具优越性。该算法已应用于科技奖励信息检索系统中,取得了良好的效果。
引用
收藏
页码:65 / 68
页数:4
相关论文
共 5 条
[1]   基于潜在语义空间的文本检索问题研究 [J].
刘海峰 ;
王元元 ;
张学仁 .
情报科学, 2007, (05) :748-753
[2]   基于矢量空间模型的文本自动分类系统研究 [J].
包剑 ;
冀常鹏 ;
李义杰 .
计算机系统应用, 2005, (03) :47-49
[3]   一种新的二叉树多类支持向量机算法 [J].
唐发明 ;
王仲东 ;
陈绵云 .
计算机工程与应用, 2005, (07) :24-26
[4]   支持向量机在多类分类问题中的推广 [J].
刘志刚 ;
李德仁 ;
秦前清 ;
史文中 .
计算机工程与应用, 2004, (07) :10-13+65
[5]   一个无需词典支持和切词处理的中文文档分类系统 [J].
周水庚 ;
关佶红 ;
胡运发 ;
周傲英 .
计算机研究与发展, 2001, (07) :839-844