基于细粒度词表示的命名实体识别研究

被引:41
作者
林广和 [1 ]
张绍武 [1 ,2 ]
林鸿飞 [1 ]
机构
[1] 大连理工大学计算机科学与技术学院
[2] 新疆财经大学计算机科学与工程学院
关键词
命名实体识别; 端到端模型; 字符级词表示模型; 注意力机制;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
命名实体识别(NER)是自然语言处理中的一项基础任务,其性能的优劣极大地影响着关系抽取、语义角色标注等后续任务。传统的统计模型特征设计难度大、领域适应性差,一些神经网络模型则忽略了词本身所具有的形态学信息。针对上述问题,该文构建了一种基于细粒度词表示的端到端模型(Finger-BiLSTM-CRF)来进行命名实体识别任务。该文首先提出一种基于注意力机制的字符级词表示模型Finger来融合形态学信息和单词的字符信息,然后将Finger与BiLSTM-CRF模型联合进行实体识别,最终该方法以端到端、无任何特征工程的方式在CoNLL 2003数据集上取得了F1为91.09%的结果。实验表明,该文设计的Finger模型显著提升NER系统的召回率,从而使得模型的识别能力显著提升。
引用
收藏
页码:62 / 71+78 +78
页数:11
相关论文
共 3 条
[1]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[2]
LEARNING LONG-TERM DEPENDENCIES WITH GRADIENT DESCENT IS DIFFICULT [J].
BENGIO, Y ;
SIMARD, P ;
FRASCONI, P .
IEEE TRANSACTIONS ON NEURAL NETWORKS, 1994, 5 (02) :157-166
[3]
MBNER:面向生物医学领域的多种实体识别系统 [J].
杨娅 ;
杨志豪 ;
林鸿飞 ;
宫本东 ;
王健 .
中文信息学报, 2016, 30 (01) :170-175+182