基于本体的农业知识问答系统智能检索技术研究

被引:0
作者
卜伟琼
机构
[1] 湖南农业大学
关键词
本体; 农业本体论; 领域本体; 问答系统; 检索; 相似度计算;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
现今网络技术的飞速发展,加快了各领域信息化的步伐,信息化技术也逐步向农业领域渗透,极大地推动了农业信息化的进程。“十二五”规划期间,农业信息化已经被明确成为我国社会发展和国民经济前进的重要任务。农业领域知识具有地域性、时效性、复杂性等特点,而服务主体——农民的科技认知水平普遍较低,在农业信息化服务中,如何从海量多样的数据中获取人们需要的信息,已经成为研究热点。问答系统的产生和发展,改善了传统搜索方式的不足,它允许用户以自然语言的方式进行提问,并返回给用户精确答案,而不是相关网页和信息。现有的问答系统在进行答案检索时大多采用对问句的关键词进行匹配的方法,而很少涉及句子或词语的语义理解层面。 针对上述问题,本文引入本体(Ontology)概念,将农业本体论(Agriculture Ontology)用于农业知识的组织和管理,为问答系统的检索提供知识语义网络基础。本体是对概念和概念之间的关系进行规范化的描述,搭建出某个领域的知识体系,使知识具有很好的共享性和重用性。农业本体是对农业领域知识中的概念和概念之间的关系以计算机可识别的形式化描述语言进行组织。本体的引入在一定程度上解决了在语义理解层面的不足。 以柑橘为例构建一个小型的柑橘病虫害知识本体来协助问答系统的问题理解、信息检索和答案抽取等过程的完成。在分析柑橘病虫害领域知识的基础上,给出了柑橘病虫害知识本体的形式化定义和元数据语义关系定义,确定了本体构建框架及核心本体,并运用本体开发工具Protege实现了柑橘病虫害知识本体的构建。 针对农业领域特点,对用户提出的问句进行预处理,使用特定分词器进行分词。基于领域本体进行问句语义理解,提取问句关键概念及其扩展概念。利用Lucene对问题-答案库构建倒排索引,设计检索方案,确定候选问题集。 结合已有的句子相似度算法,在本体的基础上,讨论了基于领域本体和基于知网的概念语义相似度算法,提出了多重信息融合的句子语义相似度计算模型,该模型综合考虑了句子的表层相似度和语义相似度。将用户问句与候选问题集中的问句进行相似度计算,将达到阈值的问句按顺序返回其相应答案给用户。最后介绍系统总体设计,并通过实验验证了模型的有效性和正确性。
引用
收藏
页数:65
共 49 条
[1]
农业知识问答系统句子相似度算法研究 [J].
卜伟琼 ;
方逵 ;
陈益能 .
农业网络信息, 2012, (10) :17-20
[2]
基于本体的蔬菜病虫害知识库构建 [J].
姜大庆 ;
蔡银杰 .
江苏农业科学, 2012, 40 (07) :368-370
[3]
中文农业专业分词器设计与实现 [J].
方逵 ;
罗武 ;
王玉娟 ;
卜伟琼 .
农业工程, 2012, 2 (03) :18-20
[4]
一种基于知网的句子相似度计算方法 [J].
程传鹏 ;
吴志刚 .
计算机工程与科学, 2012, 34 (02) :172-175
[5]
玉米病虫害诊治本体构建技术研究附视频 [J].
张伶子 ;
段青玲 ;
李道亮 .
农机化研究, 2012, (01) :41-45
[6]
本体研究综述 [J].
侯阳 ;
刘扬 ;
孙瑜 .
计算机工程, 2011, 37(S1) (S1) :24-26
[7]
一种改进的加权模糊推理方法 [J].
沈君 ;
苗俊红 .
海南师范大学学报(自然科学版), 2011, 24 (02) :134-136
[8]
水稻病虫草害本体的构建研究 [J].
戴才萍 ;
黄义德 ;
钱平 ;
王儒敬 ;
董伟 ;
黄庆 .
广东农业科学, 2011, 38 (01) :191-194
[9]
基于CBR的蔬菜病虫害诊治专家系统的研究 [J].
刘鹤 ;
李东明 ;
陈桂芬 .
安徽农业科学, 2010, 38 (27) :15380-15381+15413
[10]
FAQ问答系统句子相似度计算 [J].
张琳 ;
胡杰 .
郑州大学学报(理学版), 2010, 42 (01) :57-61