基于多源信息融合的中文农作物病虫害命名实体识别

被引:32
作者
李林
周晗
郭旭超
刘成启
苏洁
唐詹
机构
[1] 中国农业大学信息与电气工程学院
基金
国家重点研发计划;
关键词
命名实体识别; 农作物病虫害; 农业自然语言处理; 中文分词; 停等算法;
D O I
暂无
中图分类号
S43 [病虫害及其防治]; TP391.1 [文字信息处理];
学科分类号
090401 [植物病理学]; 120506 [数字人文];
摘要
随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针对中文农作物病虫害数据集缺失问题,提出了基于半远程监督的停等算法,利用该算法构建中文农作物病虫害领域语料库,大幅度减少标注过程的人工成本和时间成本;同时,提出了中文农作物病虫害命名实体识别模型(Agricultural information extraction, Agr-IE),该模型基于BERT-BILSTM-CRF,辅以多源信息融合(多源分词信息和全局词汇嵌入信息)丰富字符向量,使其充分结合字符级与词汇级的信息,以提高模型捕捉上下文信息的能力。实验表明,该模型可以有效地识别病害、虫害、药剂、作物等实体,F1值分别为96.56%、95.12%、94.48%、95.54%,并对识别难度较大的病原实体具有较好的识别效果,F1值为81.48%,高于BERT-BILSTM-CRF、BERT等模型的相应值。本文所提模型在MSRA和Weibo等其他领域数据集上与CAN-NER、Lattice-LSTM-CRF等模型进行了对比实验,并取得最佳的识别效果,F1值分别为95.80%、94.57%,表明该算法具有一定的泛化能力。
引用
收藏
页码:253 / 263
页数:11
相关论文
共 13 条
[1]
基于注意力机制的农业文本命名实体识别 [J].
赵鹏飞 ;
赵春江 ;
吴华瑞 ;
王维 .
农业机械学报, 2021, 52 (01) :185-192
[2]
基于部首嵌入和注意力机制的病虫害命名实体识别 [J].
郭旭超 ;
唐詹 ;
刁磊 ;
周晗 ;
李林 .
农业机械学报, 2020, 51(S2) (S2) :335-343
[3]
面向食品安全事件新闻文本的实体关系抽取研究 [J].
郑丽敏 ;
齐珊珊 ;
田立军 ;
杨璐 .
农业机械学报, 2020, 51 (07) :244-253
[4]
基于条件随机场的农作物病虫害及农药命名实体识别 [J].
李想 ;
魏小红 ;
贾璐 ;
陈昕 ;
刘磊 ;
张彦娥 .
农业机械学报, 2017, 48(S1) (S1) :178-185
[5]
基于条件随机场的农业命名实体识别研究 [J].
王春雨 ;
王芳 .
河北农业大学学报, 2014, 37 (01) :132-135
[6]
A Double Adversarial Network Model for Multi-Domain and Multi-Task Chinese Named Entity Recognition:Regular Section[J] Yun HU;Changwen ZHENG IEICE Transactions on Information and Systems 2020,
[7]
Recognizing Named Entities in Agriculture Documents using LDA based Topic Modelling Techniques[J] Veena Gangadharan;Deepa Gupta Procedia Computer Science 2020,
[8]
Semantic relation extraction using sequential and tree-structured LSTM with attention[J] ZhiQiang Geng;GuoFei Chen;YongMing Han;Gang Lu;Fang Li Information Sciences 2020,
[9]
CWPC_BiAtt: Character–Word–Position Combined BiLSTM-Attention for Chinese Named Entity Recognition[J] Shardrom Johnson;Sherlock Shen;Yuanchen Liu Information 2020,
[10]
Adaptive moment estimation for polynomial nonlinear equalizer in PAM8-based optical interconnects.[J] Zhou Ji;Wang Haide;Wei Jinlong;Liu Long;Huang Xincheng;Gao Shecheng;Liu Weiping;Li Jianping;Yu Changyuan;Li Zhaohui Optics express 2019,