共 5 条
基于二叉树多类支持向量机的文本分类研究
被引:4
作者:
龙军
王易
刘高嵩
机构:
[1] 中南大学信息科学与工程学院
来源:
关键词:
向量空间模型;
特征表示;
特征提取;
多类支持向量机;
二叉树文本分类;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
文本分类是文本数据挖掘的基础和核心,为解决在文本分类中二值支持向量机不能进行多类分类的问题,论文提出采用二叉树对多个二值支持向量机(SVM)子分类器进行组合,并运用聚类分析中类距离方法规范二叉树生成过程的基于二叉树的多类支持向量机(MSVM)分类算法。实验数据表明,相对于KNN算法和朴素贝叶斯算法,基于二叉树的MSVM算法在文本分类上更具优越性。该算法已应用于科技奖励信息检索系统中,取得了良好的效果。
引用
收藏
页码:65 / 68
页数:4
相关论文