多神经网络协作的军事领域命名实体识别

被引:84
作者
尹学振 [1 ]
赵慧 [2 ]
赵俊保 [3 ]
姚婉薇 [1 ]
黄泽林 [1 ]
机构
[1] 华东师范大学软件工程学院
[2] 华东师范大学上海市高可信计算重点实验室
[3] 北京遥感信息研究所
关键词
军事命名实体识别; 双向偏码器(BERT); 模糊边界; 多神经网络;
D O I
10.16511/j.cnki.qhdxxb.2020.25.004
中图分类号
E91 [军事技术基础科学]; TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
110101 [军事思想]; 120506 [数字人文]; 140502 [人工智能];
摘要
互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。
引用
收藏
页码:648 / 655
页数:8
相关论文
共 6 条
[1]
Named Entity Recognition in Chinese Clinical Text Using Deep Neural Network.[J].Indra Neil Sarkar;Andrew Georgiou;Paulo Mazzoncini de Azevedo Marques;Yonghui Wu;Min Jiang;Jianbo Lei;Hua Xu.Studies in Health Technology and Informatics.2015,
[2]
基于深度学习的作战文书命名实体识别 [J].
张晓海 ;
操新文 ;
高源 .
指挥控制与仿真, 2019, 41 (04) :22-26
[3]
基于深度学习的军事命名实体识别方法 [J].
王学锋 ;
杨若鹏 ;
朱巍 .
装甲兵工程学院学报, 2018, 32 (04) :94-98
[4]
基于CNN-BLSTM-CRF模型的生物医学命名实体识别 [J].
李丽双 ;
郭元凯 .
中文信息学报, 2018, 32 (01) :116-122
[5]
基于深度神经网络的武器名称识别 [J].
游飞 ;
张激 ;
邱定 ;
于铭华 .
计算机系统应用, 2018, 27 (01) :239-243
[6]
面向军事文本的命名实体识别 [J].
冯蕴天 ;
张宏军 ;
郝文宁 .
计算机科学, 2015, 42 (07) :15-18+47