分段卷积神经网络在文本情感分析中的应用

被引:28
作者
杜昌顺
黄磊
机构
[1] 北京交通大学经济管理学院
关键词
情感分析; 深度学习; 卷积神经网络; 分段池化; Dropout算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本情感分析是当前网络舆情分析、产品评价、数据挖掘等领域的重要任务。由于当前网络数据的急剧增长,依靠人工设计特征或者传统的自然语言处理语法分析工具等进行分析,不但准确率不高而且费时费力。而传统的卷积神经网络模型均未考虑句子的结构信息,并且在训练时很容易发生过拟合。针对这两方面的不足,使用基于深度学习的卷积神经网络模型分析文本的情感倾向,采用分段池化的策略将句子结构考虑进来,分段提取句子不同结构的主要特征;并且引入Dropout算法以避免模型的过拟合和提升泛化能力。实验结果表明,分段池化策略和Dropout算法均有助于提升模型的性能,所提方法在中文酒店评价数据集上达到了91%的分类准确率,在斯坦福英文情感树库数据集五分类任务上达到了45.9%的准确率,较基线模型都有显著的提升。
引用
收藏
页码:173 / 179
页数:7
相关论文
共 2 条
[1]   基于语义分析的词汇倾向识别研究 [J].
李钝 ;
乔保军 ;
曹元大 ;
万月亮 .
模式识别与人工智能, 2008, 21 (04) :482-487
[2]  
基于情感词典的中文微博情感倾向分析研究.[D].陈晓东.华中科技大学.2012, 07