基于LSTM-Attention神经网络的文本特征提取方法

被引:79
作者
赵勤鲁
蔡晓东
李波
吕璐
机构
[1] 桂林电子科技大学信息与通信学院
关键词
LSTM-Attention; 注意力机制; 文本分类; 神经网络; 文本特征提取; softmax;
D O I
10.16652/j.issn.1004-373x.2018.08.041
中图分类号
TP183 [人工神经网络与计算]; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
针对当前文本分类神经网络不能充分提取词语与词语和句子与句子之间的语义结构特征信息的问题,提出一种基于LSTM-Attention的神经网络实现文本特征提取的方法。首先,分别使用LSTM网络对文本的词语与词语和句子与句子的特征信息进行提取;其次,使用分层的注意力机制网络层分别对文本中重要的词语和句子进行选择;最后,将网络逐层提取得到的文本特征向量使用softmax分类器进行文本分类。实验结果表明,所提方法可以有效地提取文本的特征,使得准确率得到提高。将该方法应用在IMDB,yelp2013和yelp2014数据集上进行实验,分别得到52.4%,66.0%和67.6%的正确率。
引用
收藏
页码:167 / 170
页数:4
相关论文
共 2 条
[1]
基于极性转移和LSTM递归网络的情感分析 [J].
梁军 ;
柴玉梅 ;
原慧斌 ;
高明磊 ;
昝红英 .
中文信息学报, 2015, (05) :152-159
[2]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780