基于多头注意力胶囊网络的文本分类模型

被引:58
作者
贾旭东
王莉
机构
[1] 太原理工大学大数据学院
关键词
胶囊网络; 多头注意力; 自然语言处理; 文本分类;
D O I
10.16511/j.cnki.qhdxxb.2020.26.006
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文本序列中各单词的重要程度及其之间的依赖关系对于识别文本类别有重要影响。胶囊网络不能选择性关注文本中重要单词,并且由于不能编码远距离依赖关系,在识别具有语义转折的文本时有很大局限性。为解决上述问题,该文提出了一种基于多头注意力的胶囊网络模型,该模型能编码单词间的依赖关系、捕获文本中重要单词,并对文本语义编码,从而有效提高了文本分类任务的效果。结果表明:该文模型在文本分类任务中效果明显优于卷积神经网络和胶囊网络,在多标签文本分类任务上效果更优,能更好地从注意力中获益。
引用
收藏
页码:415 / 421
页数:7
相关论文
共 1 条
[1]
Large-scale Bayesian logistic regression for text categorization [J].
Genkin, Alexander ;
Lewis, David D. ;
Madigan, David .
TECHNOMETRICS, 2007, 49 (03) :291-304