农业知识文本库检索系统关键技术研究

被引:0
作者
王玉娟
机构
[1] 湖南农业大学
关键词
农业知识库; 检索系统; 排序算法; Lucene; 全文检索;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
农业知识库作为现代农业科技信息化服务的基础和核心,其重要性不言而喻。而随着农业服务平台的构建及各类信息资源的增加,如何优化、整合农业信息资源、如何智能搜索信息及如何对接各类信息平台,保证信息的及时性与准确性就成为当前农业信息服务平台的一个中心课题。本文即以湖南省科技厅项目为背景,定位在农业知识库检索系统的构建,构建一个更适合农业更适应湖南的特色检索系统。主要工作有: 1.结合湖南省农业知识库的特色,改进了基于向量空间模型建模的排序算法、归一化计算排序算法以及仿lucene打分计算方法,并对三个算法进行了评估; 2.结合改进的层进式最短路径分词算法,在lucene索引的基础上,增加索引路径,增加农业词汇和非农业词汇融入索引词汇排序,设计并实现了适合湖南省农业知识库的索引; 3.结合湖南省农业特色如方言、区域、主要产品等,进行系统和数据库的总体设计,对系统所需的各种模块进行性能、功能的剖析,构建系统详细总体架构图、检索系统主要工作流程图、时序图,提高检索系统性能和检索结果精准度; 4.使用lucene全文检索工具包进行二次开发,构建了基于服务平台内部数据库的快速、智能化的信息检索系统,并基本达到能根据诉求农户的问题关键词,实现快速、智能搜索与匹配,形成准确答案,完成应诉的要求。
引用
收藏
页数:60
共 36 条
[1]
搜索引擎.[M].李晓明;闫宏飞;王继民著;.科学出版社.2005,
[2]
搜索引擎与信息获取技术.[M].徐宝文;张卫丰著;.清华大学出版社.2003,
[3]
基于主体知识库的WEB主体信息抽取系统.[J].陈磊;.科技信息.2011, 32
[4]
可重构的农业知识服务模式研究 [J].
刘波 ;
方逵 ;
沈岳 .
农机化研究 , 2011, (11) :66-70
[6]
湖南农村信息化现状调研与启示 [J].
刘波 ;
徐稳 ;
沈岳 .
吉林农业, 2011, (05) :61-63
[7]
基于二次TF* IDF的互信息文本特征选择算法研究 [J].
王园 ;
龚尚福 .
计算机应用与软件, 2011, 28 (04) :129-131
[8]
利用本体关联度改进的TF-IDF特征词提取方法 [J].
徐建民 ;
王金花 ;
马伟瑜 .
情报科学, 2011, 29 (02) :279-283
[9]
一种基于知识库的语义检索系统模型 [J].
马中杰 ;
郑诚 ;
苏喻 .
微型机与应用, 2010, 29 (20) :70-73
[10]
基于统计的分词系统字典模型研究 [J].
李小龙 .
湖北工业大学学报, 2010, 25 (05) :71-73+79