基于语义理解注意力神经网络的多元特征融合中文文本分类

被引:28
作者
谢金宝
侯永进
康守强
李佰蔚
张霄
机构
[1] 哈尔滨理工大学电气与电子工程学院
关键词
中文文本分类; 多元特征融合; 注意力算法; 长短期记忆网络; 卷积神经网络;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TP391.1 [文字信息处理];
学科分类号
摘要
在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文本分类模型(3CLA)。模型首先通过文本预处理将中文文本分词、向量化。然后,通过嵌入层分别经过CNN通路、LSTM通路和注意力算法模型通路以提取不同层次、具有不同特点的文本特征。最终,文本特征经融合层融合后,由softmax分类器进行分类。基于中文语料进行了文本分类实验。实验结果表明,相较于CNN结构模型与LSTM结构模型,提出的算法模型对中文文本类别的识别能力最多提升约8%。
引用
收藏
页码:1258 / 1265
页数:8
相关论文
共 5 条
  • [1] 基于双线性函数注意力Bi-LSTM模型的机器阅读理解
    刘飞龙
    郝文宁
    陈刚
    靳大尉
    宋佳星
    [J]. 计算机科学, 2017, 44(S1) (S1) : 92 - 96+122
  • [2] 基于多维扩展特征与深度学习的微博短文本情感分析
    孙晓
    彭晓琪
    胡敏
    任福继
    [J]. 电子与信息学报, 2017, 39 (09) : 2048 - 2055
  • [3] 结合卷积神经网络和词语情感序列特征的中文情感分析
    陈钊
    徐睿峰
    桂林
    陆勤
    [J]. 中文信息学报, 2015, 29 (06) : 172 - 178
  • [4] 基于卷积神经网络的微博情感倾向性分析
    刘龙飞
    杨亮
    张绍武
    林鸿飞
    [J]. 中文信息学报, 2015, (06) : 159 - 165
  • [5] 基于极性转移和LSTM递归网络的情感分析
    梁军
    柴玉梅
    原慧斌
    高明磊
    昝红英
    [J]. 中文信息学报, 2015, 29 (05) : 152 - 159