基于注意机制的化学药物命名实体识别

被引:40
作者
杨培
杨志豪
罗凌
林鸿飞
王健
机构
[1] 大连理工大学计算机科学与技术学院
关键词
长短期记忆网络; 注意; 条件随机场; 化学药物命名实体识别; 深度学习;
D O I
暂无
中图分类号
R95 [药事组织]; TP391.1 [文字信息处理];
学科分类号
1007 ; 081203 ; 0835 ;
摘要
在生物医学文本挖掘领域,化学药物命名实体识别具有重要意义.目前的主流方法是基于条件随机场(conditional random fields,CRF)的方法,但是该方法需要大量的人工特征,并且存在实体标签的全文非一致性问题.针对此问题,提出一种基于注意(Attention)机制的深度学习方法.该方法首先从海量生物文本中学习词向量,然后利用双向长短期记忆网络(BiLSTM)学习字符向量,随后将词向量和字符向量再经过另一个BiLSTM以获得词的上下文表示,然后再利用Attention机制获得词在全文范围下的上下文表示,最后利用CRF层得到整篇文章的标签序列.实验结果表明:相比之前的研究方法,提高了在同一篇文章中实体识别的一致性,并在BioCreative IV评测中的CHEMDNER数据集上取得了更好的结果(F值为90.77%).
引用
收藏
页码:1548 / 1556
页数:9
相关论文
共 5 条
[1]  
CHEMDNER system with mixed conditional random fields and multi-scale word clustering.[J].Yanan Lu;Donghong Ji;Xiaoyuan Yao;Xiaomei Wei;Xiaohui Liang.Journal of Cheminformatics.2015, S1
[2]   Deep learning [J].
LeCun, Yann ;
Bengio, Yoshua ;
Hinton, Geoffrey .
NATURE, 2015, 521 (7553) :436-444
[3]   CHEMDNER: The drugs and chemical names extraction challenge [J].
Krallinger, Martin ;
Leitner, Florian ;
Rabal, Obdulia ;
Vazquez, Miguel ;
Oyarzabal, Julen ;
Valencia, Alfonso .
JOURNAL OF CHEMINFORMATICS, 2015, 7
[4]  
Framewise phoneme classification with bidirectional LSTM and other neural network architectures.[J].Alex Graves;Jürgen Schmidhuber.Neural Networks.2005, 5
[5]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780