基于深度循环神经网络的跨领域文本情感分析

被引:50
作者
余传明
机构
[1] 中南财经政法大学信息与安全工程学院
关键词
跨领域; 迁移学习; 深度循环神经网络; 情感分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
[目的 /意义]通过在标注资源丰富的源领域(Source Domain)中学习,并将目标领域(Target Domain)的文档投影到与源领域相同的特征空间(Feature Space)中去,从而解决目标领域因标注数据量较小而难以获得好的分类模型的问题。[方法 /过程]选择亚马逊在书籍、DVD和音乐类目下的中文评论作为实验数据,以跨领域情感分析作为研究任务,提出一种跨领域深度循环神经网络(Cross Domain Deep Recurrent Neural Network,CD-DRNN)模型,实现不同领域环境下的知识迁移。CD-DRNN模型在跨领域环境下的平均分类准确度达到了81. 70%,优于传统的栈式长短时记忆网络(Stacked Long Short Term Memory,Stacked-LSTM)模型(79. 90%)、双向长短时记忆网络模型(Bidirectional Long Short Term Memory,Bi-LSTM)模型(80. 50%)、卷积神经网络长短时记忆网络串联(Convolution Neural Network with Long Short Term Memory,CNN-LSTM)(74. 70%)模型以及卷积神经网络长短时记忆网络并联(Merged Convolution Neural Network with Long Short Term Memory,Merged-CNNLSTM)模型(80. 90%)。[结果 /结论]源领域和目标领域的知识迁移能够有效解决监督学习在小数据集上难以获得好的分类效果的问题,通过CD-DRNN模型能够从无标注数据中有效地筛选特征,从而大大降低目标领域数据标注相关的工作量。
引用
收藏
页码:23 / 34
页数:12
相关论文
共 6 条
[1]
使用机器学习方法进行新闻的情感自动分类 [J].
徐军 ;
丁宇新 ;
王晓龙 .
中文信息学报, 2007, (06) :95-100
[2]
Visual domain adaptation via transfer feature learning [J].
Tahmoresnezhad, Jafar ;
Hashemi, Sattar .
KNOWLEDGE AND INFORMATION SYSTEMS, 2017, 50 (02) :585-605
[3]
Deep learning for sentiment analysis: successful approaches and future challenges [J].
Tang, Duyu ;
Qin, Bing ;
Liu, Ting .
WILEY INTERDISCIPLINARY REVIEWS-DATA MINING AND KNOWLEDGE DISCOVERY, 2015, 5 (06) :292-303
[4]
A Survey on Concept Drift Adaptation [J].
Gama, Joao ;
Zliobaite, Indre ;
Bifet, Albert ;
Pechenizkiy, Mykola ;
Bouchachia, Abdelhamid .
ACM COMPUTING SURVEYS, 2014, 46 (04)
[5]
Principal component analysis [J].
Abdi, Herve ;
Williams, Lynne J. .
WILEY INTERDISCIPLINARY REVIEWS-COMPUTATIONAL STATISTICS, 2010, 2 (04) :433-459
[6]
Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32