中文命名实体识别综述

被引:25
作者
赵山
罗睿
蔡志平
机构
[1] 国防科技大学计算机学院
基金
国家重点研发计划;
关键词
命名实体识别(NER); 晶格结构; 神经网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
中文命名实体识别(NER)任务是信息抽取领域内的一个子任务,其任务目标是给定一段非结构文本后,从句子中寻找、识别和分类相关实体,例如人名、地名和机构名称。中文命名实体识别是一个自然语言处理(NLP)领域的基本任务,在许多下游NLP任务中,包括信息检索、关系抽取和问答系统中扮演着重要角色。全面回顾了现有的基于神经网络的单词-字符晶格结构的中文NER模型。首先介绍了中文NER相比英语NER难度更大,存在着中文文本相关实体边界难以确定和中文语法结构复杂等难点及挑战。然后调研了在不同神经网络架构下(RNN、CNN、GNN和Transformer)最具代表性的晶格结构的中文NER模型。由于单词序列信息可以给基于字符的序列学习更多边界信息,为了显式地利用每个字符所相关的词汇信息,过去的这些工作提出通过词-字符晶格结构将单词信息整合到字符序列中。这些在中文NER任务上基于神经网络的单词-字符晶格结构的性能要明显优于基于单词或基于字符的方法。最后介绍了中文NER的数据集及评价标准。
引用
收藏
页码:296 / 304
页数:9
相关论文
共 12 条
[1]   基于BGRU-CRF的中文命名实体识别方法 [J].
石春丹 ;
秦岭 .
计算机科学, 2019, 46 (09) :237-242
[2]   信息抽取研究综述 [J].
郭喜跃 ;
何婷婷 .
计算机科学, 2015, 42 (02) :14-17+38
[3]  
基于深度学习的联合实体关系抽取[D]. 孙长志.华东师范大学. 2019
[4]  
基于深度学习的实体与关系联合提取方法研究[D]. 邹晶.电子科技大学. 2019
[5]  
Adversarial training based lattice LSTM for Chinese clinical named entity recognition[J] . Shan Zhao,Zhiping Cai,Haiwen Chen,Ye Wang,Fang Liu,Anfeng Liu. Journal of Biomedical Informatics . 2019 (C)
[6]  
A Survey on Recent Advances in Named Entity Recognition from Deep Learning models.[J] . Vikas Yadav,Steven Bethard. CoRR . 2019
[7]   Core techniques of question answering systems over knowledge bases: a survey [J].
Diefenbach, Dennis ;
Lopez, Vanessa ;
Singh, Kamal ;
Maret, Pierre .
KNOWLEDGE AND INFORMATION SYSTEMS, 2018, 55 (03) :529-569
[8]  
End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF.[J] . Xuezhe Ma,Eduard H. Hovy. CoRR . 2016
[9]  
F-Score Driven Max Margin Neural Network for Named Entity Recognition in Chinese Social Media.[J] . Hangfeng He,Xu Sun 0001. CoRR . 2016
[10]   A survey of named entity recognition and classification [J].
Nadeau, David ;
Sekine, Satoshi .
LINGUISTICAE INVESTIGATIONES, 2007, 30 (01) :3-26