共 5 条
基于语义理解注意力神经网络的多元特征融合中文文本分类
被引:28
作者:
谢金宝
侯永进
康守强
李佰蔚
张霄
机构:
[1] 哈尔滨理工大学电气与电子工程学院
来源:
关键词:
中文文本分类;
多元特征融合;
注意力算法;
长短期记忆网络;
卷积神经网络;
D O I:
暂无
中图分类号:
TP183 [人工神经网络与计算];
TP391.1 [文字信息处理];
学科分类号:
摘要:
在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文本分类模型(3CLA)。模型首先通过文本预处理将中文文本分词、向量化。然后,通过嵌入层分别经过CNN通路、LSTM通路和注意力算法模型通路以提取不同层次、具有不同特点的文本特征。最终,文本特征经融合层融合后,由softmax分类器进行分类。基于中文语料进行了文本分类实验。实验结果表明,相较于CNN结构模型与LSTM结构模型,提出的算法模型对中文文本类别的识别能力最多提升约8%。
引用
收藏
页码:1258 / 1265
页数:8
相关论文