基于BERT-BiLSTM-CRF模型的中文实体识别

被引:279
作者
谢腾
杨俊安
刘辉
机构
[1] 国防科技大学电子对抗学院
基金
安徽省自然科学基金;
关键词
命名实体识别; BERT模型; 双向长短期记忆网络; 条件随机场; 词向量;
D O I
10.15888/j.cnki.csa.007525
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
命名实体识别是自然语言处理的一项关键技术.基于深度学习的方法已被广泛应用到中文实体识别研究中.大多数深度学习模型的预处理主要注重词和字符的特征抽取,却忽略词上下文的语义信息,使其无法表征一词多义,因而实体识别性能有待进一步提高.为解决该问题,本文提出了一种基于BERT-BiLSTM-CRF模型的研究方法.首先通过BERT模型预处理生成基于上下文信息的词向量,其次将训练出来的词向量输入BiLSTM-CRF模型做进一步训练处理.实验结果表明,该模型在MSRA语料和人民日报语料库上都达到相当不错的结果, F1值分别为94.65%和95.67%.
引用
收藏
页码:48 / 55
页数:8
相关论文
共 12 条
[1]
基于BERT-IDCNN-CRF的中文命名实体识别方法 [J].
李妮 ;
关焕梅 ;
杨飘 ;
董文永 .
山东大学学报(理学版), 2020, 55 (01) :102-109
[2]
Trans-NER:一种迁移学习支持下的中文命名实体识别模型 [J].
王银瑞 ;
彭敦陆 ;
陈章 ;
刘丛 .
小型微型计算机系统, 2019, 40 (08) :1622-1626
[3]
基于迁移学习和BiLSTM-CRF的中文命名实体识别 [J].
武惠 ;
吕立 ;
于碧辉 .
小型微型计算机系统, 2019, 40 (06) :1142-1147
[4]
基于Bi-LSTM和注意力机制的命名实体识别 [J].
刘晓俊 ;
辜丽川 ;
史先章 .
洛阳理工学院学报(自然科学版), 2019, 29 (01) :65-70+77
[5]
基于深度神经网络的网络安全实体识别方法 [J].
秦娅 ;
申国伟 ;
赵文波 ;
陈艳平 .
南京大学学报(自然科学), 2019, 55 (01) :29-40
[6]
基于神经网络的片段级中文命名实体识别 [J].
王蕾 ;
谢云 ;
周俊生 ;
顾彦慧 ;
曲维光 .
中文信息学报, 2018, (03) :84-90+100
[7]
基于CNN-BLSTM-CRF模型的生物医学命名实体识别 [J].
李丽双 ;
郭元凯 .
中文信息学报, 2018, 32 (01) :116-122
[8]
融合迁移学习的中文命名实体识别 [J].
王红斌 ;
沈强 ;
线岩团 .
小型微型计算机系统, 2017, 38 (02) :346-351
[9]
基于HMM的京剧机构命名实体识别算法 [J].
乐娟 ;
赵玺 .
计算机工程, 2013, 39 (06) :266-271+286
[10]
CRF与规则相结合的地理空间命名实体识别 [J].
鞠久朋 ;
张伟伟 ;
宁建军 ;
周国栋 .
计算机工程, 2011, 37 (07) :210-212+215