基于叙词表和文献数据库的农业领域本体构建方法研究

被引:0
作者
张磊
机构
[1] 中国农业科学院
关键词
农业领域本体; 构建方法; 叙词表; 农业文献;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
我国是一个农业大国,农业的发展对于国民经济的增长具有举足轻重的作用,而农业领域的科学研究则与农业发展有着直接而密切的联系。目前,农业领域的科研人员所面临的一个困扰就是自己被信息的海洋所湮没,无法方便地获得自己需要的信息,根本原因在于传统的知识组织方式固有的弊端。而本体的构建可以在很大程度上解决这个问题。 本文在研究了国内外大量相关文献的基础上,提出了以《农业科学叙词表》和农业领域文献为基础进行农业领域本体半自动构建的思路。该思想的提出基于以下两点:(1)《农表》是现已有的知识体系,是农业领域专家集体智慧的结晶,它提供了最丰富、最权威的术语集合,从中进行领域概念和术语的提取,可以保证本体知识体系的完整性和规范性。(2)农业领域文献作为本体概念的另一个来源,则是《农表》最为有力的补充,它存储量大,动态性好,可以为本体的构建提供更为广泛的术语范围和更复杂的概念关系。 文章对于农业文献的篇章结构进行了研究,并据此提出了农业领域本体的整体框架,确定了主要的类、属性及类间关系,横向上保证了本体框架的科学性和合理性;对于《农表》编制结构、收录的术语范围、术语间关系进行了深入剖析,挑取出了本体的主要研究类目,纵向上划定了本体构建的范围。《农表》与农业文献二者的结合将文献的外部特征与内部结构进行了知识关联,为知识本体的构建奠定了良好的基础。研究中还详细介绍了领域本体半自动构建过程中所要用到的重要工具和关键技术,构建工具包括中文分词工具ICTCLAS、PDF转换WORD工具,关键技术主要为自然语言处理技术,其中涉及中文分词、词性标注、特定结构句式和短语的提取、聚类技术等等。最后部分系统而详细地说明了本体中各类元素的构建流程和步骤,具体包括类的构建、属性的构建、关系的识别以及实例的获取。 文章的最后对于农业领域本体半自动构建方法进行了总结和探讨,并对下一步的工作进行了展望。
引用
收藏
页数:67
共 62 条
[1]
领域本体的构建方法与应用研究 [D]. 
李景 .
中国农业科学院,
2009
[2]
基于叙词表的中医古籍文献领域本体建模方法研究 [D]. 
谷建军 .
中国中医科学院,
2006
[3]
Ontology在农业信息管理中的构建和转化 [D]. 
常春 .
中国农业科学院,
2004
[4]
基于统计的多文档关键短语和文摘抽取研究 [D]. 
张永刚 .
苏州大学,
2010
[5]
中文自动分词系统的研究与实现 [D]. 
周程远 .
华东师范大学,
2010
[6]
科技论文关键词抽取技术的研究 [D]. 
严春风 .
苏州大学,
2009
[7]
基于领域本体的用户查询词扩展方法的研究 [D]. 
张冰 .
西华大学,
2009
[8]
基于用户词典的搜索个性化研究 [D]. 
罗颖 .
重庆大学,
2009
[9]
基于机器学习的中文文本分类方法研究 [D]. 
刘依璐 .
西安电子科技大学,
2009
[10]
基于领域本体的语义信息检索及相关技术研究 [D]. 
刘爱军 .
西北大学,
2008