近年来本体在知识管理和语义网络中扮演着越来越重要的角色,是许多应用的必不可少的一部分。有了本体的支持,不管是用户还是系统都能使用一个领域的共同理解来进行交流。由于缺乏结构化的知识库或词典,自动本体构建技术具有较高的复杂度。本体构建通常依赖于领域专家,它是一件周期长,代价高且具有争议性的工作。
本文以SSE-CMM模型文档模板为基础,自动构建本体并应用于乏燃料后处理系统安全工程能力成熟度评估系统中。由于评估系统要求使用SSE-CMM模型本体,为了有效存储和利用本体概念之间的关系,完成应用领域的知识与SSE-CMM通用模型之间的关联,本文采用抽取本体的方法对模型进行存储管理和利用。主要工作包括以下几个部分:
(1)参照国内外知名本体的结构,完成领域本体组成结构和本体自动构建方案设计,结合SSE-CMM模型在评估系统中的应用设计SSE-CMM领域本体的结构。
(2)使用结合标准文档的结构信息及概念关系的方法改进术语抽取过程,在抽取本体概念层级关系过程中利用模板定义的结构的方法获取术语,完成本体关系抽取后,利用概念关系对术语的准确性进行验证。
(3)提出基于关联规则和模板抽取领域本体关系的方法。本文充分考虑了模型标准文本的布局特征,利用模板与统计相结合的方法获得领域本体关系,将其作为线索运用文本的“局部性特征”完成领域本体关系的抽取。