基于迁移学习的实时多类别文本分类方法研究

被引:1
作者
蒲国林 [1 ]
卫洪春 [1 ]
谢茂森 [2 ]
机构
[1] 四川文理学院计算机学院
[2] 四川文理学院数学与财经学院
关键词
多类别; 迁移学习; 增量学习; 文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
在实时文本分类任务中经常会有新类别出现,传统的文本分类方法通常难以利用实时的小规模样本学习新类别的模型.提出了一种基于迁移学习的新类别模型训练方法.首先将迁移学习技术和LS-SVM算法结合,设计正则化项以控制源模型的迁移量及新模型与源模型的相似度,达到增量迁移.其次具体讨论了正则化项的学习方法.实验结果显示该方法相对同类算法有更好的分类性能,可以更高效地完成各种实时文本分类任务.
引用
收藏
页码:33 / 38
页数:6
相关论文
共 5 条
[1]
一种新的类增量学习方法 [J].
秦玉平 ;
陈一荻 ;
王春立 ;
王秀坤 .
计算机工程与应用, 2011, 47 (34) :181-183+237
[2]
基于密度的kNN文本分类器训练样本裁剪方法 [J].
李荣陆 ;
胡运发 .
计算机研究与发展, 2004, (04) :539-545
[3]
Data weighting method on the basis of binary encoded output to solve multi-class pattern classification problems [J].
Polat, Kemal .
EXPERT SYSTEMS WITH APPLICATIONS, 2013, 40 (11) :4637-4647
[4]
On incremental and robust subspace learning [J].
Li, YM .
PATTERN RECOGNITION, 2004, 37 (07) :1509-1518
[5]
Least squares support vector machine classifiers [J].
Suykens, JAK ;
Vandewalle, J .
NEURAL PROCESSING LETTERS, 1999, 9 (03) :293-300