基于注意力机制的农业文本命名实体识别

被引:70
作者
赵鹏飞 [1 ]
赵春江 [1 ,2 ]
吴华瑞 [2 ,3 ]
王维 [2 ,3 ]
机构
[1] 山西农业大学工学院
[2] 国家农业信息化工程技术研究中心
[3] 北京农业信息技术研究中心
基金
国家重点研发计划;
关键词
农业文本; 命名实体识别; 注意力机制; 神经网络; 深度学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论]; S126 [电子技术、计算机技术在农业上的应用];
学科分类号
082806 [农业信息与电气工程]; 120506 [数字人文]; 140502 [人工智能];
摘要
针对农业智能问答系统构建过程中传统的农业命名实体识别方法依赖人工特征模板、特征信息提取不充分、实体名称多样导致标注不一致等问题,提出一种基于注意力机制的农业文本命名实体识别方法。采用连续词袋模型(Continuous bag of words,CBOW)对输入字向量进行预训练,丰富字向量特征信息,缓解分词准确度对性能的影响;引入文档级的注意力(Attention)机制获取实体间相似信息,保证实体在不同语境下的标签一致性;基于双向长短期记忆网络(Bi-directional long-short term memory,BiLSTM)和条件随机场(Conditional random field,CRF)模型构建适合农业领域实体识别的模型框架。选取4 604篇农业文本,针对病害、虫害、农药、农作物品种4类实体进行了识别实验。结果表明,模型能有效地辨别农业文本中的实体,缓解实体标记不一致的问题,在农业语料上达到了较好的结果,识别的准确率、召回率、F值分别为93.48%、90.60%、92.01%。与其他3种识别方法相比,模型在不同规模语料库的准确率均有一定提高具有明显的性能优势。
引用
收藏
页码:185 / 192
页数:8
相关论文
共 12 条
[1]
A Comparison of Word Embeddings for the Biomedical Natural Language Processing.[J].Yanshan Wang;Sijia Liu;Naveed Afzal;Majid Rastegar-Mojarad;Liwei Wang;Feichen Shen;Paul Kingsbury;Hongfang Liu.Journal of Biomedical Informatics.2018,
[2]
Disease named entity recognition from biomedical literature using a novel convolutional neural network.[J].Zhehuan Zhao;Zhihao Yang;Ling Luo;Lei Wang;Yin Zhang;Hongfei Lin;Jian Wang.BMC Medical Genomics.2017, 5
[3]
Character-level neural network for biomedical named entity recognition.[J].Mourad Gridach.Journal of Biomedical Informatics.2017,
[4]
基于语义分割的食品标签文本检测 [J].
田萱 ;
王子亚 ;
王建新 .
农业机械学报, 2020, 51 (08) :336-343
[5]
基于CNN-CRF的中文电子病历命名实体识别研究 [J].
曹依依 ;
周应华 ;
申发海 ;
李智星 .
重庆邮电大学学报(自然科学版), 2019, (06) :869-875
[6]
基于本体的水稻育种方法应用知识库构建 [J].
赖英旭 ;
李亚娟 ;
刘静 .
北京工业大学学报, 2019, 45 (12) :1181-1191
[7]
结合GAN与BiLSTM-Attention-CRF的领域命名实体识别 [J].
张晗 ;
郭渊博 ;
李涛 .
计算机研究与发展, 2019, 56 (09) :1851-1858
[8]
基于双向LSTM的军事命名实体识别 [J].
李健龙 ;
王盼卿 ;
韩琪羽 .
计算机工程与科学, 2019, 41 (04) :713-718
[9]
基于深度神经网络的网络安全实体识别方法 [J].
秦娅 ;
申国伟 ;
赵文波 ;
陈艳平 .
南京大学学报(自然科学), 2019, 55 (01) :29-40
[10]
基于BiLSTM-CNN-CRF模型的维吾尔文命名实体识别 [J].
买买提阿依甫 ;
吾守尔·斯拉木 ;
帕丽旦·木合塔尔 ;
杨文忠 .
计算机工程, 2018, 44 (08) :230-236