序列—结构的文本分类算法

被引:3
作者
刘蕊
沈海斌
机构
[1] 浙江大学超大规模集成电路设计研究所
关键词
Bi-LSTM; CNN; 文本分类; 注意力机制;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
Bi-LSTM输入为时间序列,可以挖掘词序列间的隐藏信息,但易忽略文本句子间的结构信息。CNN具位移不变性的优势,可以有效抽取文本句子间的结构特征,但很难察觉词序列间的隐藏信息。因此文章提出了序列—结构的文本分类算法,该算法将Bi-LSTM和CNN相结合形成优势互补,从词序列和文本结构上抽取文本信息,并结合注意力机制,减少信息冗余,优化特征向量,进一步提高分类的准确性。选择单纯的神经网络和加入注意力机制的神经网络作为比较对象,证明本算法的可行性和有效性。
引用
收藏
页码:1 / 4
页数:4
相关论文
共 7 条
[1]
基于Attention-Based LSTM模型的文本分类技术的研究 [D]. 
张冲 .
南京大学,
2016
[2]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[3]
基于卷积神经网络和注意力模型的文本情感分析 [J].
冯兴杰 ;
张志伟 ;
史金钏 .
计算机应用研究, 2018, 35 (05) :1434-1436
[4]
基于长短期记忆多维主题情感倾向性分析模型 [J].
滕飞 ;
郑超美 ;
李文 .
计算机应用, 2016, 36 (08) :2252-2256
[5]
基于word embedding和CNN的情感分类模型 [J].
蔡慧苹 ;
王丽丹 ;
段书凯 .
计算机应用研究, 2016, 33 (10) :2902-2905+2909
[6]
基于SVM新闻文本分类的研究 [J].
张国梁 ;
肖超锋 .
电子技术, 2011, 38 (08) :16-17
[7]
两种分类方法特征选择的比较 [J].
王晓微 .
电子技术, 2007, (Z3) :132-134