用于微博情感分析的一种情感语义增强的深度学习模型

被引:118
作者
何炎祥 [1 ,2 ]
孙松涛 [1 ]
牛菲菲 [1 ]
李飞 [1 ]
机构
[1] 武汉大学计算机学院
[2] 武汉大学软件工程国家重点实验室
基金
高等学校博士学科点专项科研基金;
关键词
微博; 情感分析; 深度学习; 卷积神经网络; 自然语言处理; 社交网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
基于神经语言模型的词向量表示技术能够从大规模的未标注文本数据集中自动学习词语的有效特征表示,已经在许多自然语言处理任务及研究中取得重要进展.微博中的表情符号是微博情感分析最重要的特征之一,已有大量的研究工作在探索有效地利用表情符号来提升微博情感分类效果.借助词向量表示技术,为常用表情符号构建情感空间的特征表示矩阵RE;基于向量的语义合成计算原理,通过矩阵RE与词向量的乘积运算完成词义到情感空间的映射;接着输入到一个MCNN(Multi-channel Convolution Neural Network)模型,学习一个微博的情感分类器.整个模型称为EMCNN(Emotion-semantics enhanced MCNN),将基于表情符号的情感空间映射与深度学习模型MCNN结合,有效增强了MCNN捕捉情感语义的能力.EMCNN模型在NLPCC微博情感评测数据集上的多个情感分类实验中取得最佳分类性能,并在所有性能指标上超过目前已知文献中的最好分类效果.在取得以上分类性能提升的同时,EMCNN相对MCNN的训练耗时在主客观分类时减少了36.15%,在情感7分类时减少了33.82%.
引用
收藏
页码:773 / 790
页数:18
相关论文
共 8 条
[1]   深度学习的昨天、今天和明天 [J].
余凯 ;
贾磊 ;
陈雨强 ;
徐伟 .
计算机研究与发展, 2013, 50 (09) :1799-1804
[2]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[3]  
情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美.情报学报. 2008 (02)
[4]   Chinese comments sentiment classification based on word2vec and SVMperf [J].
Zhang, Dongwen ;
Xu, Hua ;
Su, Zengcai ;
Xu, Yunfeng .
EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42 (04) :1857-1863
[5]   Composition in Distributional Models of Semantics [J].
Mitchell, Jeff ;
Lapata, Mirella .
COGNITIVE SCIENCE, 2010, 34 (08) :1388-1429
[6]  
Annotating Expressions of Opinions and Emotions in Language[J] . Janyce Wiebe,Theresa Wilson,Claire Cardie.Language Resources and Evaluation . 2006 (2-3)
[7]  
Emoticons and social interaction on the Internet: the importance of social context[J] . Daantje Derks,Arjan E.R. Bos,Jasper von Grumbkow.Computers in Human Behavior . 2004 (1)
[8]  
From tweets to polls:Linking text sentiment to public opinion time series. O’’ Connor B,Balasubramanyan R,Routledge B R, et al. The International AAAI Conference on Weblogs and Social Media . 2010