植物领域知识图谱构建中本体非分类关系提取方法

被引:19
作者
赵明
杜亚茹
杜会芳
张家军
王红说
陈瑛
机构
[1] 中国农业大学信息与电气工程学院
关键词
植物领域本体; 知识图谱; 非分类关系; 本体学习; 百度百科;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
采用本体学习的方法,以百度百科植物类词条内容的非结构和半结构化中文文本信息作为语料进行处理。使用一种有指导的基于依存句法分析的词汇-语法模式来获取植物领域的概念、分类和非分类关系,并分别利用基于词表过滤的方法和给模式添加限制的方法,较大程度地提高了关系抽取的精确度,完成在轻量级本体的基础上自动构建重量级本体。该方法建立了一个特定领域语料的概念层次,提高了最具代表性的分类和非分类关系的发现,并使用OWL语言形式化表达抽取结果。实验表明,该方法在非分类关系抽取上取得了较好的结果,为该领域知识图谱构建奠定了基础。
引用
收藏
页码:278 / 284
页数:7
相关论文
共 18 条