基于word embedding和CNN的情感分类模型

被引:20
作者
蔡慧苹
王丽丹
段书凯
机构
[1] 西南大学电子信息工程学院
关键词
卷积神经网络; 自然语言处理; 深度学习; 词嵌入; 情感分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
尝试将word embedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用skip-gram模型训练出数据集中每个词的word embedding,然后将每条样本中出现的word embedding组合为二维特征矩阵作为卷积神经网络的输入,此外每次迭代训练过程中,输入特征也作为参数进行更新;其次,设计了一种具有三种不同大小卷积核的神经网络结构,从而完成多种局部抽象特征的自动提取过程。与传统机器学习方法相比,所提出的基于word embedding和CNN的情感分类模型成功地将分类正确率提升了5.04%。
引用
收藏
页码:2902 / 2905+2909 +2909
页数:5
相关论文
共 5 条
[1]   基于深度信念网络的文本分类算法 [J].
陈翠平 .
计算机系统应用, 2015, 24 (02) :121-126
[2]   基于SVM和CRF多特征组合的微博情感分析 [J].
李婷婷 ;
姬东鸿 .
计算机应用研究, 2015, 32 (04) :978-981
[3]   A fast learning algorithm for deep belief nets [J].
Hinton, Geoffrey E. ;
Osindero, Simon ;
Teh, Yee-Whye .
NEURAL COMPUTATION, 2006, 18 (07) :1527-1554
[4]  
Dropout:asimple way to prevent neural networks from overfitting .2 Srivastava N,Hinton G,Krizhevsky A,et al. Journal of Machine Learning Research . 2014
[5]  
https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz 2 .