水稻病虫草害与药剂实体关系联合抽取算法

被引:32
作者
沈利言 [1 ]
姜海燕 [1 ,2 ]
胡滨 [1 ]
谢元澄 [1 ]
机构
[1] 南京农业大学人工智能学院
[2] 南京农业大学国家信息农业工程技术中心
基金
国家重点研发计划;
关键词
病虫草害; 实体关系抽取; 长短期记忆网络; 注意力机制;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; S435.11 [稻病虫害]; S451.21 [水田化学除草];
学科分类号
090401 [植物病理学]; 090403 [农药学]; 120506 [数字人文];
摘要
[目的]从水稻病虫草害防治文本中,自动抽取病虫草害与药剂之间的实体与关系,为构建作物系统领域知识图谱提供数据。[方法]针对病虫草害防治文本中含有大量实体没有明确边界以及药剂与病虫草害实体之间存在多种类型关系的特点,设计了一种基于新标注模式的双层长短期记忆(bi-directional long short-term memory,BiLSTM)网络与注意力机制结合的水稻病虫草害与药剂的实体关系联合抽取算法(joint entity recognition and relation extraction for rice diseases,pests and weeds,JE-DPW)。该方法在解码层利用BiLSTM网络的前向传播和反向传播,增强对病虫草害防治文本中复杂语义特征的提取;再通过softmax分类器获取字符的类别标签,实现实体识别;与此同时,利用注意力机制判断当前字符与之前字符之间存在的关联关系,实现实体与多关系的联合抽取。[结果]利用包含7 380个实体、8 605个关系的病虫草害防治文本数据集训练模型,使用测试集测试后发现:JE-DPW算法在病虫草害与药剂的实体抽取和关系分类任务中的准确率分别为91.3%和76.8%,对无边界实体识别的准确率为88.1%。与BiLSTM实现实体抽取方法相比,准确率高出8.1%。与利用循环神经网络(recurrent neural network,RNN)和长短期记忆网络(long short-term memory,LSTM)实现关系分类的方法相比,准确率分别高出22.6%和19.7%;随着关系数量的增加,JE-DPW算法在关系抽取上的F1值可保持17.4%~20.1%的优势。[结论]本文提出的算法可以有效提升水稻病虫草害防治文本中实体关系联合抽取的准确度,提高作物系统领域知识库的构建速度。
引用
收藏
页码:1151 / 1161
页数:11
相关论文
共 12 条
[1]
Joint Extraction of Entities and Relations Using Reinforcement Learning and Deep Learning.[J].Yuntian Feng;Hongjun Zhang;Wenning Hao;Gang Chen;Athanasios Voulodimos.Computational Intelligence and Neuroscience.2017,
[2]
Joint entity and relation extraction based on a hybrid neural network.[J].Suncong Zheng;Yuexing Hao;Dongyuan Lu;Hongyun Bao;Jiaming Xu;Hongwei Hao;Bo Xu.Neurocomputing.2016,
[3]
Named Entity Recognition: Fallacies, challenges and opportunities [J].
Marrero, Monica ;
Urbano, Julian ;
Sanchez-Cuadrado, Sonia ;
Morato, Jorge ;
Miguel Gomez-Berbis, Juan .
COMPUTER STANDARDS & INTERFACES, 2013, 35 (05) :482-489
[4]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[5]
基于神经网络的药物实体与关系联合抽取 [J].
曹明宇 ;
杨志豪 ;
罗凌 ;
林鸿飞 ;
王健 .
计算机研究与发展 , 2019, (07) :1432-1440
[6]
深度学习实体关系抽取研究综述 [J].
鄂海红 ;
张文静 ;
肖思琪 ;
程瑞 ;
胡莺夕 ;
周筱松 ;
牛佩晴 .
软件学报, 2019, 30 (06) :1793-1818
[7]
基于联合模型的藏文实体关系抽取方法研究 [J].
夏天赐 ;
孙媛 .
中文信息学报, 2018, (12) :76-83
[8]
基于条件随机场的农作物病虫害及农药命名实体识别 [J].
李想 ;
魏小红 ;
贾璐 ;
陈昕 ;
刘磊 ;
张彦娥 .
农业机械学报, 2017, 48(S1) (S1) :178-185
[9]
基于BLSTM的命名实体识别方法 [J].
冯艳红 ;
于红 ;
孙庚 ;
孙娟娟 .
计算机科学, 2018, 45 (02) :261-268
[10]
知识图谱研究进展 [J].
漆桂林 ;
高桓 ;
吴天星 .
情报工程, 2017, 3 (01) :4-25