结合注意力机制的长文本分类方法

被引:83
作者
卢玲
杨武
王远伦
雷子鉴
李莹
机构
[1] 重庆理工大学计算机科学与工程学院
关键词
注意力机制; 卷积神经网络; 段落向量; 信息过滤; 文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
新闻文本常包含几十至几百条句子,因字符数多、包含较多与主题无关信息,影响分类性能。对此,提出了结合注意力机制的长文本分类方法。首先将文本的句子表示为段落向量,再构建段落向量与文本类别的神经网络注意力模型,用于计算句子的注意力,将句子注意力的均方差作为其对类别的贡献度,进行句子过滤,然后构建卷积神经网络(CNN)分类模型,分别将过滤后的文本及其注意力矩阵作为网络输入。模型用max pooling进行特征过滤,用随机dropout防止过拟合。实验在自然语言处理与中文计算(NLP&CC)评测2014的新闻分类数据集上进行。当过滤文本长度为过滤前文本的82.74%时,19类新闻的分类正确率为80.39%,比过滤前文本的分类正确率超出2.1%,表明结合注意力机制的句子过滤方法及分类模型,可在句子级信息过滤的同时提高长文本分类正确率。
引用
收藏
页码:1272 / 1277
页数:6
相关论文
共 5 条
[1]
Composition in Distributional Models of Semantics [J].
Mitchell, Jeff ;
Lapata, Mirella .
COGNITIVE SCIENCE, 2010, 34 (08) :1388-1429
[2]
数据仓库和数据挖掘.[M].苏新宁[等]编著;.清华大学出版社.2006,
[3]
文本分割算法对中文信息过滤影响研究 [J].
朱寰 ;
阮彤 ;
于庆喜 ;
不详 .
计算机工程与应用 , 2002, (13) :62-65
[4]
一种改进的kNN方法及其在文本分类中的应用 [J].
孙丽华 ;
张积东 ;
李静梅 .
应用科技, 2002, (02) :25-27
[5]
中文文本的关键词自动抽取和模糊分类 [J].
何新贵 ;
彭甫阳 .
中文信息学报, 1999, (01)