一种主动学习和协同训练相结合的半监督微博情感分类方法

被引:16
作者
毕秋敏 [1 ]
李明 [2 ]
曾志勇 [3 ]
机构
[1] 昆明理工大学艺术与传媒学院
[2] 云南财经大学信息学院
[3] 云南财经大学信息管理中心
关键词
协同训练; 主动学习; 情感分类;
D O I
暂无
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
【目的】针对微博情感分类时未标注样本多和已标注集少的问题,提出一种新的方法。【方法】在协同训练算法的基础上引入主动学习思想,从低置信度样本中选取最有价值的、信息含量大的,提交标注,标注完后添加到训练集中,重新训练分类器进行情感分类。【结果】使用不同的数据集进行实验,实验结果表明该方法所构建的分类器性能优于其他方法,分类准确率明显提高。特别是在已标注样本占40%的情况下,提升5%左右。【局限】在协同训练过程中使用随机特征子空间生成方法不能保证每次构建的两个分类器都是强分类器,因此未能充分地满足协同训练的假设条件。【结论】引入主动学习思想后,能够解决协同训练对低置信度样本处理的不足,进而增强分类器性能,提高分类准确率。
引用
收藏
页码:38 / 44
页数:7
相关论文
共 4 条
[1]
基于情绪词的非监督中文情感分类方法研究 [J].
代大明 ;
王中卿 ;
李寿山 ;
李培峰 ;
朱巧明 .
中文信息学报, 2012, (04) :103-108
[2]
基于情绪知识的中文微博情感分类方法 [J].
庞磊 ;
李寿山 ;
周国栋 .
计算机工程, 2012, 38 (13) :156-158+162
[3]
一种新型的中文文本情感计算模型 [J].
徐群岭 .
计算机应用与软件, 2011, 28 (06) :271-272+285
[4]
基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20