从文本中构建领域本体技术综述

被引:143
作者
任飞亮
沈继坤
孙宾宾
朱靖波
机构
[1] 东北大学计算机科学与工程学院
[2] 东北大学医学影像计算教育部重点实验室
关键词
本体构建; 本体术语抽取; 本体概念抽取; 本体关系抽取; 深度学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP181 [自动推理、机器学习];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
本体是一种重要的知识库,其包含的丰富的语义信息可以为问答系统、信息检索、语义Web、信息抽取等领域的研究及相关应用提供重要的支持.因而,如何快速有效地构建本体具有非常重要的研究价值.研究者们分别从不同角度提出了大量有效地进行本体构建的方法.一般来讲,这些本体构建方法可以分为手工构建的方法和采用自动、半自动技术构建的方法.手工本体的方法往往需要本体专家参与到构建的整个过程,存在着构建成本高、效率低下、主观性强、移植不便等缺点,因而,此类方法正逐步被大量基于自动、半自动技术的本体构建方法所代替.自动、半自动构建的方法不需要(或仅需少量)人工参与,可以很方便地使用其它研究领域(如机器学习、自然语言处理等)的最新研究成果,也可以方便地使用不同数据源进行本体构建.其中,文本数据源具有数据量大、获取方便的优点.因而,越来越多的研究者开始关注如何有效地使用文本资源进行本体构建.该文全面分析了以文本为数据源,采用自动、半自动技术进行本体构建的国内外最新研究成果.该文首先介绍了当前一些具有代表性的关于以文本为数据源进行本体构建的技术综述文章.在这一部分内容中,该文重点关注了各个综述文章针对本体构建技术研究所得出的结论.接着,该文从"全局"与"局部"两个角度对本体构建方法进行了详细的介绍.在"全局"角度介绍中,该文根据本体构建过程中用到的主导技术,将本体构建方法分为统计主导的方法和语言分析主导的方法两类,分别对各类方法进行了详细的介绍,并分析了各类方法的优缺点.在"局部"角度介绍中,该文把本体构建过程分为以下子任务:术语抽取、概念抽取、关系(包括层次关系和非层次关系)抽取、本体形成.分别从每个任务所使用的技术,从"任务-技术"这一角度,介绍了当前以文本为数据源进行本体构建的国内外最新技术研究进展.第三,该文对当前本体构建技术的常用评价方法以及最新关于本体构建技术评价方法的研究成果进行了介绍.第四,该文选取了几种当前在国际上具有广泛影响力的本体构建系统,对其进行本体构建的具体过程以及生成的本体结果进行了介绍.第五,该文对当前本体构建研究过程中所面临的问题和挑战进行了深入的分析.最后,该文结合当前机器学习及自然语言处理研究领域的最新研究成果,讨论了本体构建未来的研究方向.
引用
收藏
页码:654 / 676
页数:23
相关论文
共 63 条
[1]
语义Web中的本体匹配研究 [J].
马良荔 ;
孙煜飞 ;
柳青 .
计算机应用研究, 2017, 34 (05) :1287-1292+1332
[2]
基于语义关联的多本体完善方法 [J].
韩欢 ;
冯志勇 ;
陈世展 ;
黄科满 .
山西大学学报(自然科学版), 2016, 39 (04) :582-592
[3]
本体研究综述 [J].
王向前 ;
张宝隆 ;
李慧宗 .
情报杂志, 2016, 35 (06) :163-170
[4]
从大数据到大知识:HACE+BigKE[J] 吴信东;何进;陆汝钤;郑南宁; 自动化学报 2016, 07
[5]
基于范畴论的本体描述方法 [J].
余珊珊 ;
苏锦钿 ;
易法令 .
计算机科学, 2016, 43 (05) :42-46+61
[6]
基于本体和语义文法的上下文相关问答 [J].
王东升 ;
王石 ;
王卫民 ;
刘亮亮 ;
符建辉 .
中文信息学报, 2016, 30 (02) :142-152+159
[7]
本体构建的粒计算学习模型 [J].
阎红灿 ;
张奉 ;
刘保相 .
计算机工程与应用, 2017, 53 (01) :87-91
[8]
基于本体的智能信息检索系统 [J].
杨月华 ;
杜军平 ;
平源 .
软件学报, 2015, 26 (07) :1675-1687
[9]
基于OMKast的术语关系获取和验证 [J].
王娜娜 ;
黄运有 ;
唐素勤 ;
王石 ;
曹存根 .
计算机应用研究, 2015, 32 (11) :3319-3323
[10]
基于并列结构的部分整体关系获取方法 [J].
夏飞 ;
曹馨宇 ;
符建辉 ;
王石 ;
曹存根 .
中文信息学报, 2015, 29 (01) :88-96