基于Bi-LSTM和注意力机制的命名实体识别

被引:29
作者
刘晓俊
辜丽川
史先章
机构
[1] 安徽农业大学信息与计算机学院
关键词
命名实体识别; DC-BiLSTM; 注意力机制; 条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
命名实体识别是自然语言处理中一项重要的基础任务,本文提出一种简单、新颖的深层循环神经网络的命名实体识别(Named Entity Recognition,NER)方法。使用一种稠密连接的方式(Dense connection,DC)在多层的双向长短期记忆神经网络(bi-directional long short-term memory, Bi-LSTM)之间传递信息,称这种网络结构为DC-BiLSTM。利用DC-BiLSTM来学习句子特征,并采用自注意力机制(self-attention)来捕捉任意两个标记之间的关系,最后使用条件随机场(CRF)对整个句子进行解码预测。实验表明结果,该方法在MSRA语料上平均F1值能达到91.81%,最高F1值能达到92.05%。
引用
收藏
页码:65 / 70+77 +77
页数:7
相关论文
共 3 条
[1]
命名实体识别研究进展综述 [J].
孙镇 ;
王惠临 .
现代图书情报技术, 2010, (06) :42-47
[2]
Densely Connected Convolutional Networks..Huang G;Liu Z;Maaten L V D;et al;.IEEE Conference on Computer Vision and Pattern Recognition (CVPR).2017,
[3]
Word representations:a simple and general method for semi-supervised learning..Joseph Turian;Lev Ratinov;Yoshua Bengio;.Proceedings of the 48th annual meeting of the association for computational linguistics.2010,