基于迁移学习微博情绪分类研究——以H7N9微博为例

被引:43
作者
周清清 [1 ]
章成志 [1 ,2 ]
机构
[1] 南京理工大学信息管理系
[2] 江苏省数据工程与知识服务重点实验室(南京大学)
关键词
情感分类; 情绪分类; 迁移学习; 微博挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
120506 [数字人文];
摘要
社交媒体的发展吸引大量用户,继而产生海量的用户生成内容。对用户生成内容的挖掘分析能够及时掌握用户的情绪动态,继而帮助事件处理、政策施行等。已有研究利用监督机器学习方法进行文本情绪分类,但是这类方法依赖于语料的标注、耗时耗力,并且存在领域适应性问题。迁移学习方法能够避免大量的语料标注、并且一定程度解决领域适应性问题。但是,目前迁移学习鲜有用于情绪分类任务。此外,情绪分类主要是针对博文等长文本,缺少针对微博短文本的相关实证研究。本文在主客观分类基础上,利用迁移学习方法对H7N9微博主观语料文本进行情感分类,并对结果进行情绪分类。实验结果表明,首先,设置形容词个数阈值为2时主客观分类效果最优;其次,利用迁移学习算法进行微博情感分类效果优于非迁移学习方法;最后,利用词频-相关频率作为特征权重计算方法时可以得到较好的情绪分类性能。
引用
收藏
页码:339 / 348
页数:10
相关论文
共 5 条
[1]
Domain Adaptation for Sentiment Classification in Light of Multiple Sources[J] Fang Fang;Kaushik Dutta;Anindya Datta INFORMS Journal on Computing 2014,
[2]
Feature selection; perceptron learning; and a usability case study for text categorization[J] Hwee Tou Ng;Wei Boon Goh;Kok Leong Low ACM SIGIR Forum 1997,
[3]
Support-Vector Networks[J] Corinna Cortes;Vladimir Vapnik Machine Learning 1995,
[4]
Effects of Adjective Orientation and Gradability On Sentence Subjectivity Hatzivassiloglou V;Wiebe J M; Proceedings of the 18th conference on Computational linguistics 2000,
[5]
http://www.ansj.org ,