超球支持向量机文本分类方法改进

被引:6
作者
胡吉明
陈果
机构
[1] 武汉大学信息资源研究中心
关键词
LDA主题模型; 超球支持向量机; 增量学习; 密度决策函数;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
【目的】针对文本分类中类别特征向量改变和重叠等问题,对超球支持向量机(HS-SVM)分类算法进行改进。【方法】基于增量学习和密度决策函数对原始HS-SVM进行改进,实现超球类支持向量的动态改变,准确计算构造超球支持向量机的决策函数,从而达到提高文本分类效果的目的。【结果】与原始超球支持向量机的文本分类实验对比表明,本文所提方法在准确率和召回率方面优于其他方案,建模时间减少且对预测精确度的影响不大。【局限】应进行多种类型数据集上的实验验证,推广方法改进的适用性;其次对分类算法的底层改进欠缺,需继续探索。【结论】本研究有利于提高大规模文本分类的准确性和减少训练时间,从而提升文本分类效果。
引用
收藏
页码:74 / 80
页数:7
相关论文
共 12 条
[1]
Topic modeling for expert finding using latent Dirichlet allocation [J].
Momtazi, Saeedeh ;
Naumann, Felix .
WILEY INTERDISCIPLINARY REVIEWS-DATA MINING AND KNOWLEDGE DISCOVERY, 2013, 3 (05) :346-353
[2]
Sphere Support Vector Machines for large classification tasks.[J].Robert Strack;Vojislav Kecman;Beata Strack;Qi Li.Neurocomputing.2013,
[3]
Large data sets classification using convex-concave hull and support vector machine [J].
Lopez Chau, Asdrubal ;
Li, Xiaoou ;
Yu, Wen .
SOFT COMPUTING, 2013, 17 (05) :793-804
[4]
A survey of techniques for incremental learning of HMM parameters.[J].Wael Khreich;Eric Granger;Ali Miri;Robert Sabourin.Information Sciences.2012,
[5]
Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47
[6]
Discovery and evaluation of aggregate usage profiles for web personalization [J].
Mobasher, B ;
Dai, H ;
Luo, T ;
Nakagawa, M .
DATA MINING AND KNOWLEDGE DISCOVERY, 2002, 6 (01) :61-82
[7]
基于球结构SVM的多标签分类 [J].
蒋华 ;
戚玉顺 .
计算机工程, 2013, 39 (01) :294-297
[8]
一种SVM不平衡分类方法及在故障诊断的应用 [J].
王德成 ;
林辉 .
电机与控制学报, 2012, 16 (09) :48-52
[9]
基于球结构支持向量机的多标签分类的主动学习 [J].
蒋华 ;
戚玉顺 .
计算机应用, 2012, 32 (05) :1359-1361
[10]
基于超球支持向量机的多主题文本分类算法 [J].
艾青 ;
秦玉平 ;
李迎春 .
计算机工程与设计, 2010, 31 (10) :2273-2275+2279