字符级卷积神经网络短文本分类算法

被引:66
作者
刘敬学 [1 ]
孟凡荣 [1 ]
周勇 [1 ]
刘兵 [1 ,2 ]
机构
[1] 中国矿业大学计算机科学与技术学院
[2] 中国科学院电子研究所
关键词
字符级; 神经网络; 文本分类; 高速公路网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
由于短文本具有长度短、特征稀疏以及上下文依赖性强等特点,传统方法对其直接进行分类精度有限。针对该问题,提出了一种基于字符级嵌入的卷积神经网络(CNN)和长短时记忆网络(LSTM)相结合的神经网络模型进行短文本的分类。该模型同时包括了高速公路网络(Highway networks)框架,用于缓解深度神经网络训练时的困难,提高分类的准确性。通过对几种数据集的测试,结果表明提出的模型在短文本分类任务中优于传统模型和其他基于CNN的分类模型。
引用
收藏
页码:135 / 142
页数:8
相关论文
共 4 条
[1]
结合卷积神经网络和词语情感序列特征的中文情感分析 [J].
陈钊 ;
徐睿峰 ;
桂林 ;
陆勤 .
中文信息学报, 2015, 29 (06) :172-178
[2]
基于卷积神经网络的微博情感倾向性分析 [J].
刘龙飞 ;
杨亮 ;
张绍武 ;
林鸿飞 .
中文信息学报, 2015, 29 (06) :159-165
[3]
Effective Use of Word Order for Text Categorization with Convolutional Neural Networks Jo Johnson R;Zhang T; North a merican chapter of the association for computational linguistics 2014,
[4]
Character-aware neural language models Kim Y;Jernite Y;Sontag D;et al; AAAI 2016,