基于神经网络的文本表示模型新方法

被引:16
作者
曾谁飞 [1 ]
张笑燕 [1 ]
杜晓峰 [2 ]
陆天波 [1 ]
机构
[1] 北京邮电大学软件学院
[2] 北京邮电大学计算机学院
关键词
神经网络; 词向量; Bi-LSTM; 文本表示;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
提出了一种改进的文本表示模型提取文本特征词向量方法。首先构建基于词典索引和所对应的词性索引的double word-embedding列表的word-embedding词向量,其次,利用在此基础上Bi-LSTM循环神经网络对生成后的词向量进一步进行特征提取,最后,通过mean-pooling层处理句子向量后且使用了softmax层进行文本分类。实验验证了Bi-LSTM和double word-embedding神经网络相结合的模型训练效果与提取情况。实验结果表明,该模型不但能较好地处理高质量的文本特征向量提取和表达序列,而且比LSTM、LSTM+context window和Bi-LSTM这3种神经网络有较明显的表达效果。
引用
收藏
页码:86 / 98
页数:13
相关论文
共 2 条
[1]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[2]  
LSTM Neural Networks for Language Modeling. Sundermeyer M,Schlüter R,Ney H. INTERSPEECH . 2012