基于VDCNN与LSTM混合模型的中文文本分类研究

被引:9
作者
彭玉青
宋初柏
闫倩
赵晓松
魏铭
机构
[1] 河北工业大学人工智能与数据科学学院
关键词
文本分类; 卷积神经网络; 长短期记忆网络; 词嵌入; 深度残差网络;
D O I
10.19678/j.issn.1000-3428.0048715
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
自然语言在结构上存在一定的前后依赖性,且将中文文本直接转化为向量时会使维度过高,从而导致现有文本分类方法精度较低。为此,建立一种超深卷积神经网络(VDCNN)与长短期记忆网络(LSTM)相结合的混合模型。通过VDCNN的深度结构来提取文本向量的特征,利用LSTM具有存储历史信息的特点提取长文本的上下文依赖关系,同时引入词嵌入将文本转换为低维度向量。在Sogou语料库和复旦大学中文语料库上进行实验,结果表明,相对CNN+rand、LSTM等模型,该混合模型可以有效提升文本分类的精确率。
引用
收藏
页码:190 / 196
页数:7
相关论文
共 9 条
[1]  
基于Attention-Based LSTM模型的文本分类技术的研究.[D].张冲.南京大学.2016, 10
[2]  
基于卷积神经网络的短文本分类方法研究.[D].蔡慧苹.西南大学.2016, 02
[3]   基于卷积神经网络和KNN的短文本分类算法研究 [J].
殷亚博 ;
杨文忠 ;
杨慧婷 ;
许超英 .
计算机工程, 2018, 44 (07) :193-198
[4]   基于文本加权KNN算法的中文垃圾短信过滤 [J].
黄文明 ;
莫阳 .
计算机工程, 2017, 43 (03) :193-199
[5]   基于递归神经网络的文本分类研究 [J].
黄磊 ;
杜昌顺 .
北京化工大学学报(自然科学版), 2017, 44 (01) :98-104
[6]   基于事件卷积特征的新闻文本分类 [J].
夏从零 ;
钱涛 ;
姬东鸿 .
计算机应用研究, 2017, 34 (04) :991-994
[7]   基于聚类改进的KNN文本分类算法 [J].
周庆平 ;
谭长庚 ;
王宏君 ;
湛淼湘 .
计算机应用研究, 2016, 33 (11) :3374-3377+3382
[8]   基于Labeled-LDA模型的文本分类新算法 [J].
李文波 ;
孙乐 ;
张大鲲 .
计算机学报, 2008, (04) :620-627
[9]  
Semantic expansion using word embedding clustering and convolutional neural network for improving short text classification.[J].Peng Wang;Bo Xu;Jiaming Xu;Guanhua Tian;Cheng-Lin Liu;Hongwei Hao.Neurocomputing.2016,