融合自注意力机制与CNN-BiGRU的事件检测

被引:21
作者
王侃 [1 ]
王孟洋 [2 ]
刘鑫 [1 ]
田国强 [3 ]
李川 [3 ]
刘伟 [2 ]
机构
[1] 中国电子科技集团公司第十研究所
[2] 西安电子科技大学通信工程学院
[3] 西安邮电大学计算机学院
关键词
事件检测; 信息抽取; 卷积神经网络; 双向门控循环单元; 自注意力机制;
D O I
10.19665/j.issn1001-2400.2022.05.021
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
基于卷积神经网络和循环神经网络的事件检测已得到广泛研究。然而卷积神经网络只能考虑卷积窗口内的局部信息,忽略了词语的上下文联系。循环神经网络存在梯度消失和短期记忆的问题,且其变体门控循环单元无法得到每个词语的特征。为此,提出一种基于自注意力机制与卷积双向门控循环单元模型的事件检测方法。该模型将词向量和位置向量作为输入,不仅能够通过卷积操作提取不同粒度的词汇级特征,通过双向门控循环单元提取句子级特征,而且通过自注意力机制考虑全局信息,关注对事件检测更重要的特征。将提取的词汇级特征和句子级特征拼接作为联合特征,通过softmax分类器进行候选词分类,从而完成事件检测任务。实验结果显示,在ACE2005英文语料上,事件检测中触发词识别和分类的F值分别达到78.9%和76.0%,优于基线事件检测方法的结果,且模型表现出更好的收敛性。实验结果表明,所提出的基于自注意力机制与卷积双向门控循环单元模型有良好文本特征提取能力,提升了事件检测的性能。
引用
收藏
页码:181 / 188
页数:8
相关论文
共 10 条
[1]
Biomedical event trigger extraction based on multi-layer residual BiLSTM and contextualized word representations.[J].Hao Wei;Ai Zhou;Yijia Zhang;Fei Chen;Wen Qu;Mingyu Lu.International Journal of Machine Learning and Cybernetics.2021, 3
[2]
LSTM-Based End-to-End Framework for Biomedical Event Extraction..[J].Yu Xinyi;Rong Wenge;Liu Jingshuang;Zhou Deyu;Ouyang Yuanxin;Xiong Zhang.IEEE/ACM transactions on computational biology and bioinformatics.2019,
[3]
A Survey of Event Extraction From Text [J].
Xiang, Wei ;
Wang, Bang .
IEEE ACCESS, 2019, 7 :173111-173137
[4]
一种基于字词双通道网络的文本情感分析方法 [J].
李源 ;
崔玉爽 ;
王伟 .
西安电子科技大学学报, 2021, 48 (06) :179-186
[5]
基于句法语义依存分析的中文金融事件抽取 [J].
万齐智 ;
万常选 ;
胡蓉 ;
刘德喜 .
计算机学报, 2021, 44 (03) :508-530
[6]
基于CNN-BiGRU模型的事件触发词抽取方法 [J].
苗佳 ;
段跃兴 ;
张月琴 ;
张泽华 .
计算机工程, 2021, 47 (09) :69-74+83
[7]
结合注意力机制与双向LSTM的中文事件检测方法 [J].
沈兰奔 ;
武志昊 ;
纪宇泽 ;
林友芳 ;
万怀宇 .
中文信息学报, 2019, 33 (09) :79-87
[8]
采用注意力门控卷积网络模型的目标情感分析 [J].
曹卫东 ;
李嘉琪 ;
王怀超 .
西安电子科技大学学报, 2019, 46 (06) :30-36
[9]
基于多任务学习的中文事件抽取联合模型 [J].
贺瑞芳 ;
段绍杨 .
软件学报, 2019, 30 (04) :1015-1030
[10]
A language-independent neural network for event detection.[J].Xiaocheng FENG;Bing QIN;Ting LIU;.Science China(Information Sciences).2018, 09