基于串并行卷积门阀循环神经网络的短文本特征提取与分类

被引:19
作者
唐贤伦 [1 ]
林文星 [1 ]
杜一铭 [2 ]
王婷 [1 ]
机构
[1] 重庆邮电大学自动化学院
[2] 重庆邮电大学计算机学院
关键词
特征表示; 短文本分类; 循环神经网络; 门阀循环单元;
D O I
10.15961/j.jsuese.201801160
中图分类号
TP183 [人工神经网络与计算]; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
针对短文本数据特征少、提供信息有限,以及传统卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)对短文本特征表示不充分的问题,提出基于串并行卷积门阀循环神经网络的文本分类模型,处理句子特征表示与短文本分类。该网络在卷积层中去除池化操作,保留文本数据的时序结构和位置信息,以串并行的卷积结构提取词语的多元特征组合,并提取局部上下文信息作为RNN的输入;以门阀循环单元(gated recurrent unit,GRU)作为RNN的组成结构,利用文本的时序信息生成句子的向量表示,输入带有附加边缘距离的分类器中,引导网络学习出具有区分性的特征,实现短文本的分类。实验中采用TREC、MR、Subj短文本分类数据集进行测试,对网络超参数选择和卷积层结构对分类准确率的影响进行仿真分析,并与常见的文本分类模型进行了对比实验。实验结果表明:去掉池化操作、采用较小的卷积核进行串并行卷积,能够提升文本数据在多元特征表示下的分类准确率。相较于相同参数规模的GRU模型,所提出模型的分类准确率在3个数据集中分别提升了2.00%、1.23%、1.08%;相较于相同参数规模的CNN模型,所提出模型的分类准确率在3个数据集中分别提升了1.60%、1.57%、0.80%。与Text–CNN、G–Dropout、F–Dropout等常见模型相比,所提出模型的分类准确率也保持最优。因此,实验表明所提出模型可改善分类准确率,可实际应用于短文本分类场景。
引用
收藏
页码:125 / 132
页数:8
相关论文
共 7 条
[1]
基于语义理解注意力神经网络的多元特征融合中文文本分类 [J].
谢金宝 ;
侯永进 ;
康守强 ;
李佰蔚 ;
张霄 .
电子与信息学报, 2018, 40 (05) :1258-1265
[2]
基于CNN特征空间的微博多标签情感分类 [J].
孙松涛 ;
何炎祥 .
工程科学与技术, 2017, 49 (03) :162-169
[3]
Attention pooling-based convolutional neural network for sentence modelling.[J].Meng Joo Er;Yong Zhang;Ning Wang;Mahardhika Pratama.Information Sciences.2016,
[4]
Using Differential Evolution for Fine Tuning Naïve Bayesian Classifiers and its Application for Text Classification.[J].Diab M. Diab;Khalil M. El Hindi.Applied Soft Computing.2016,
[5]
A less-greedy two-term Tsallis Entropy Information Metric approach for decision tree classification.[J].Yisen Wang;Shu-Tao Xia;Jia Wu.Knowledge-Based Systems.2016,
[6]
Chinese comments sentiment classification based on word2vec and SVMperf [J].
Zhang, Dongwen ;
Xu, Hua ;
Su, Zengcai ;
Xu, Yunfeng .
EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42 (04) :1857-1863
[7]
TESC: An approach to TExt classification using Semi-supervised Clustering.[J].Wen Zhang;Xijin Tang;Taketoshi Yoshida.Knowledge-Based Systems.2015,