基于BERT嵌入的中文命名实体识别方法

被引:129
作者
杨飘
董文永
机构
[1] 武汉大学计算机学院
基金
国家重点研发计划;
关键词
中文命名实体识别; BERT模型; BiGRU模型; 预训练语言模型; 条件随机场;
D O I
10.19678/j.issn.1000-3428.0054272
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在基于神经网络的中文命名实体识别过程中,字的向量化表示是重要步骤,而传统的词向量表示方法只是将字映射为单一向量,无法表征字的多义性。针对该问题,通过嵌入BERT预训练语言模型,构建BERT-BiGRU-CRF模型用于表征语句特征。利用具有双向Transformer结构的BERT预训练语言模型增强字的语义表示,根据其上下文动态生成语义向量。在此基础上,将字向量序列输入BiGRU-CRF模型中进行训练,包括训练整个模型和固定BERT只训练BiGRU-CRF 2种方式。在MSRA语料上的实验结果表明,该模型2种训练方式的F1值分别达到95.43%和94.18%,优于BiGRU-CRF、Radical-BiLSTM-CRF和Lattice-LSTM-CRF模型。
引用
收藏
页码:40 / 45+52 +52
页数:7
相关论文
共 7 条
  • [1] 在线医疗问答文本的命名实体识别
    杨文明
    褚伟杰
    [J]. 计算机系统应用, 2019, 28 (02) : 8 - 14
  • [2] 基于SVM-BiLSTM-CRF模型的财产纠纷命名实体识别方法
    周晓磊
    赵薛蛟
    刘堂亮
    宗子潇
    王其乐
    里剑桥
    [J]. 计算机系统应用, 2019, 28 (01) : 245 - 250
  • [3] 基于GRU的命名实体识别方法
    王洁
    张瑞东
    吴晨生
    [J]. 计算机系统应用, 2018, 27 (09) : 18 - 24
  • [4] 基于注意机制的化学药物命名实体识别
    杨培
    杨志豪
    罗凌
    林鸿飞
    王健
    [J]. 计算机研究与发展, 2018, (07) : 1548 - 1556
  • [5] 基于CNN-BLSTM-CRF模型的生物医学命名实体识别
    李丽双
    郭元凯
    [J]. 中文信息学报, 2018, 32 (01) : 116 - 122
  • [6] Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J] . Alex Graves,Jürgen Schmidhuber.Neural Networks . 2005 (5)
  • [7] Deep contextualized word representations .2 PETERS M E,NEUMANN M,IYYER M,et al. https://arxiv.org/pdf/ 1810.04805.pdf . 2019