用于短文本分类的BLSTMMLPCNN模型

被引:26
作者
郑诚
洪彤彤
薛满意
机构
[1] 安徽大学计算机科学与技术学院
关键词
字符级向量; 词向量; 卷积神经网络(CNN); 双向长短时记忆神经网络(BLSTM); 多层感知器(MLP); 多层感知器卷积网络(MLPCNN);
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
文本表示和文本特征提取是自然语言处理的基础工作,直接影响文本分类的性能。文中提出了以字符级向量联合词向量作为输入的BLSTMMLPCNN神经网络模型。该模型首先将卷积神经网络(CNN)作用于字符以获取字符级向量,并将字符级向量联合词向量作为预训练词嵌入向量,也即双向长短时记忆网(BLSTM)模型的输入;然后联合BLSTM模型的前向输出、词嵌入向量、后向输出构成文档特征图;最后利用多层感知器卷积神经网络(MLPCNN)进行特征提取。在相关数据集上的实验结果表明:相比于CNN,RNN以及CNN与RNN的组合模型,BLSTMMLPCNN模型具有更优的分类性能。
引用
收藏
页码:206 / 211
页数:6
相关论文
共 3 条
[1]
基于自然标注信息和隐含主题模型的无监督文本特征抽取 [J].
饶高琦 ;
于东 ;
荀恩东 .
中文信息学报, 2015, 29 (06) :141-149
[2]
基于领域词语本体的短文本分类 [J].
宁亚辉 ;
樊兴华 ;
吴渝 .
计算机科学, 2009, 36 (03) :142-145
[3]
基于卷积神经网络的短文本分类方法研究 [D]. 
蔡慧苹 .
西南大学,
2016