加入自注意力机制的BERT命名实体识别模型

被引:59
作者
毛明毅 [1 ]
吴晨 [1 ]
钟义信 [2 ]
陈志成 [2 ]
机构
[1] 北京工商大学计算机与信息工程学院
[2] 北京邮电大学计算机学院
基金
北京市自然科学基金;
关键词
命名实体识别; BERT; 自注意力机制; 深度学习; 条件随机场; 自然语言处理; 双向长短期记忆网络; 序列标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
命名实体识别属于自然语言处理领域词法分析中的一部分,是计算机正确理解自然语言的基础。为了加强模型对命名实体的识别效果,本文使用预训练模型BERT(bidirectional encoder representation from transformers)作为模型的嵌入层,并针对BERT微调训练对计算机性能要求较高的问题,采用了固定参数嵌入的方式对BERT进行应用,搭建了BERT-BiLSTM-CRF模型。并在该模型的基础上进行了两种改进实验。方法一,继续增加自注意力(self-attention)层,实验结果显示,自注意力层的加入对模型的识别效果提升不明显。方法二,减小BERT模型嵌入层数。实验结果显示,适度减少BERT嵌入层数能够提升模型的命名实体识别准确性,同时又节约了模型的整体训练时间。采用9层嵌入时,在MSRA中文数据集上F1值提升至94.79%,在Weibo中文数据集上F1值达到了68.82%。
引用
收藏
页码:772 / 779
页数:8
相关论文
共 10 条
[1]
An algorithm that learns what's in a name [J].
Bikel, DM ;
Schwartz, R ;
Weischedel, RM .
MACHINE LEARNING, 1999, 34 (1-3) :211-231
[2]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[3]
面向电力智能问答系统的命名实体识别算法 [J].
杨维 ;
孙德艳 ;
张晓慧 ;
李子乾 ;
李承桓 ;
吴佐平 .
计算机工程与设计, 2019, 40 (12) :3625-3630
[4]
面向国防科技领域的技术和术语识别方法研究 [J].
冯鸾鸾 ;
李军辉 ;
李培峰 ;
朱巧明 .
计算机科学, 2019, 46 (12) :231-236
[5]
基于深度主动学习的信息安全领域命名实体识别研究 [J].
彭嘉毅 ;
方勇 ;
黄诚 ;
刘亮 ;
姜政伟 .
四川大学学报(自然科学版), 2019, (03) :457-462
[6]
植物属性文本的命名实体识别方法研究 [J].
李冬梅 ;
檀稳 .
计算机科学与探索 , 2019, (12) :2085-2093
[7]
反馈式K近邻语义迁移学习的领域命名实体识别 [J].
朱艳辉 ;
李飞 ;
冀相冰 ;
曾志高 ;
徐啸 .
智能系统学报, 2019, 14 (04) :820-830
[8]
融入自注意力机制的社交媒体命名实体识别 [J].
李明扬 ;
孔芳 .
清华大学学报(自然科学版), 2019, 59 (06) :461-467
[9]
命名实体识别研究综述 [J].
刘浏 ;
王东波 .
情报学报, 2018, 37 (03) :329-340
[10]
融合迁移学习的中文命名实体识别 [J].
王红斌 ;
沈强 ;
线岩团 .
小型微型计算机系统, 2017, 38 (02) :346-351