随着计算机技术的不断发展,本体被广泛的应用到计算机的各个领域,发挥着巨大的作用。作为本体应用的基础,本体的构建方法越来越成为国内外科研人员研究的热点。虽然本体构建工具已经非常的成熟,但是手工构建本体仍然是一项费力的工作。
本文的主要内容是对半自动本体构建方法的学习与研究,提出了一种基于文本统计的本体半自动构建流程。该方法的流程是:首先手工构建一个核心本体:然后对文本数据集的统计信息进行处理,使用文本分类方法和关键词提取方法对文本统计表中领域相关术语进行提取,生成本体概念候选集;然后使用wordnet判断候选集中概念和核心本体中概念的语义关系,将匹配的概念自动加入到核心本体中,实现对核心本体的扩展;最后通过人工的修改和完善,生成最终的领域本体。
通过对各个步骤进行测试和验证,证实了这种方法的可行性。这种半自动本体构建方法,减少了人在构建过程中的工作量,提高了本体构建的效率,并且保证了本体的质量。