本体映射是解决语义Web发展瓶颈的关键技术。但是,随着语义Web的发展,出现了一类概念数目庞大,概念之间关系复杂的大规模本体。由于大规模本体和普通本体在所包含的实体数目和映射难度上存在着不同,因而应当针对它们采用不同的映射方法。本文将着重对大规模本体分块与映射进行研究。
首先,简要介绍了课题的研究背景,总结了本体映射技术当前的研究现状,并给出了未来的发展方向。
其次,针对传统的单个本体中语义相似度计算未充分利用本体中的语义信息等不足,提出了一种基于概念特征的语义相似度计算方法。该方法首先根据概念在本体中的所处的层次结构来确定其特征集合,并引入概念的宽度因素对各个特征赋予不同权值,然后采用计算集合相似度的方法来计算概念的相似度,最后引入深度影响因子,并对相似度计算公式进行修正,转换成一种更直观的形式。理论分析和实验结果表明,该方法计算简便,结果准确。
再次,针对当前的大规模本体映射方法存在的自动化程度不高,分块大小不均匀等问题,提出一种基于图分割的大规模本体分块与映射方法。该方法首先对本体进行预处理,将待匹配的大规模本体转换成有向无环图,从而将大规模本体分块问题转换成图分割问题,然后采用基于遗传算法的GPO算法分别对这两个本体图进行分割,将本体划分成本体块集合,最后通过采用基于参考点策略和基于本体块结构策略相结合的方法识别正确的块映射。
最后,根据上述研究,本文设计并实现了的大规模本体分块与映射系统LSOPM,并将其和当前的大规模本体映射系统进行了比较。实验结果表明,该系统分块结果好,块映射准确,且在查全率和查准率方面都有明显提高。