农作物病虫害知识图谱构建研究

被引:0
作者
李悦
机构
[1] 中国农业科学院
关键词
农作物病虫害; 本体; 命名实体识别; 知识图谱;
D O I
10.27630/d.cnki.gznky.2021.000692
年度学位
2021
学位类型
硕士
导师
摘要
我国农作物病虫害种类繁多,据统计仅常见病虫害就达到1400种以上,每年因为病虫害的影响对农作物产量、农民收入的损失非常严重。同时,因农作物病虫害数据来源广泛,数据表示、存储与组织等方式各有不同,资源处于无序与相对混乱的状态,各类用户难以快速、高效地查询与使用多方面农作物病虫害信息资源,从而导致知识难以被有效利用。随着数据密集型科学研究第四范式以及知识图谱的提出,利用知识图谱技术对多源异构病虫害数据进行整合,充分挖掘隐含在文本内的知识,对于帮助用户厘清知识脉络、提高知识获取和传播的效率、提升农业智能化知识服务能力具有重要意义。对此,本文借鉴融合了多来源、多载体的专业化高质量知识资源并通过引入深度学习算法进行知识抽取,探索有关农业领域半自动化知识图谱构建方法与技术路线。同时,尝试将农作物病虫害领域知识图谱与通用知识图谱以及传统的知识组织体系进行融合,在分析其应用场景的基础上,设计与实现了知识问答原型系统进行应用验证,进而为新型智能化知识服务实践提供相关思路。本文首先介绍了知识图谱的起源与现状,并对农作物病虫害相关本体及知识图谱的研究现状、存在问题进行分析;其次,本文对知识图谱的概念进行了介绍并对构建知识图谱需要运用到的有关技术方法进行阐述,涉及到的方法主要包括:本体构建的相关知识、实体识别、知识存储、知识融合方法,相关概念与方法为本研究的开展提供了理论支撑;其三,在农作物病虫害知识图谱模式层的构建方面,本文对农作物病虫害关于构建本体的目标与流程进行了分析研究,重点基于《农业科学叙词表》、病虫害权威专著《中国农作物病虫害》和国家农业图书馆的文献资源,构建了含有13个一级类、25个二级类、20个三级类,15个一级对象属性,36个一级数据属性的农作物病虫害领域本体,并基于OWL+SKOS语言对本体进行形式化表示;其四,在农作物病虫害知识图谱数据层的构建方面,本文先对数据层的构建流程作出了介绍,然后基于BERT-Bi LSTMCRF模型、实体链接等技术方法,完成了结构化、非结构化数据的半自动化知识抽取、知识融合实验,并运用Neo4j进行知识存储,形成了含有9类实体、9种关系,共计16842个节点、24303个三元组的农作物病虫害知识图谱;最后,基于构建的农作物病虫害知识图谱,设计并实现了知识问答原型系统进行应用验证,结果表明:本文构建的知识图谱实现了多源病虫害知识的形式化、规范化描述组织和深度融合,为开展深层次的知识挖掘奠定了基础。
引用
收藏
页数:64
共 57 条
[1]
基于多种数据源的中文知识图谱构建方法研究 [D]. 
胡芳槐 .
华东理工大学,
2015
[2]
面向多源数据深度融合的农作物病虫害本体构建研究 [J].
李悦 ;
孙坦 ;
鲜国建 ;
赵瑞雪 ;
李娇 ;
黄永文 ;
罗婷婷 .
数字图书馆论坛, 2021, (02) :2-10
[3]
融合预训练模型的中文知识图谱问题生成方法 [J].
叶子 ;
陈小平 ;
张波 ;
欧阳昱 ;
刘辉舟 .
小型微型计算机系统, 2021, 42 (02) :246-250
[4]
文本挖掘技术在农业知识服务中的应用述评 [J].
孙坦 ;
丁培 ;
黄永文 ;
鲜国建 .
农业图书情报学报, 2021, 33 (01) :4-16
[5]
基于注意力机制的农业文本命名实体识别 [J].
赵鹏飞 ;
赵春江 ;
吴华瑞 ;
王维 .
农业机械学报, 2021, 52 (01) :185-192
[6]
大规模RDF三元组转换及存储工具比较研究 [J].
李悦 ;
孙坦 ;
赵瑞雪 ;
李娇 ;
黄永文 ;
罗婷婷 ;
鲜国建 .
数字图书馆论坛, 2020, (11) :2-12
[7]
基于BERT-BiLSTM-CRF模型的中文实体识别 [J].
谢腾 ;
杨俊安 ;
刘辉 .
计算机系统应用, 2020, 29 (07) :48-55
[8]
基于BERT的医疗电子病历命名实体识别 [J].
梁文桐 ;
朱艳辉 ;
詹飞 ;
冀相冰 .
湖南工业大学学报, 2020, 34 (04) :54-62
[9]
认知计算及其在农业领域的应用研究 [J].
王婷 ;
崔运鹏 ;
王健 ;
刘婷婷 ;
王末 .
农业图书情报, 2019, 31 (04) :4-18
[10]
知识图谱研究综述 [J].
黄恒琪 ;
于娟 ;
廖晓 ;
席运江 .
计算机系统应用, 2019, 28 (06) :1-12