数据是科技创新的源泉,领域数据的集成与共享是数据密集型应用的重要基础。由于领域数据往往具有分布性和异构性,使各数据源间的交互变得困难,数据源之间的语义不一致成为领域数据与知识共享的巨大障碍,如何在语义层面进行特定领域数据的集成与共享是当前的一个研究热点。由于不同领域具有不同的特点,所以科学数据集成的研究往往围绕特定领域展开。本文结合采油工程领域的应用需求,深入探讨领域公共数据模型和语义集成技术,实现基于领域数据云的应用服务系统,主要工作和贡献如下:(1)针对采油工程领域数据源分布的特点,结合采油工程实际应用需求和中国石油天然气集团公司采油工程数据的现状,提出了一种采油工程领域数据云实现框架,给出了一个采油工程领域数据应用服务系统的体系结构。通过该层次型的体系结构,实现数据库粒度的集成,为采油工程领域数据共享、数据应用服务系统开发提供方便的数据支持。(2)针对采油工程领域数据模式集成的问题,提出了一个采油工程领域公共数据模型DMO (Data Model for Oil & Gas Lifting EngineeringData)及其构建方法。DMO从采油工程领域的需求出发,为领域数据提供一个形式化的知识表示方法。DMO通过一种最大公共子串算法抽取领域概念,通过描述逻辑公理和规则进一步描述了概念之间的内在联系,根据这些公理和规则可以推理出领域相关的隐含知识。(3)针对采油工程领域数据的语义异构问题,提出了一种基于领域本体的采油工程数据语义集成方法。该方法利用DMO作为全局领域模型,通过构建领域语义本体和语义模型,建立数据源到本体对应元素之间的映射关系,实现领域数据的语义查询和集成。这种采油工程领域数据语义集成方法在油气井故障诊断、优化设计及辅助决策等实际应用中得到应用并验证了该方法的有效性。(4)针对采油工程领域实际的生产应用需求,建立了基于领域数据云的应用服务系统,该系统在大港、华北、吉林和大庆等油田部署并投入应用11个月,证明了领域数据云实现框架、采油工程领域公共数据模型、采油工程领域数据语义集成方法的实用性和有效性。采油工程领域应用服务系统的推广与应用产生了良好的经济效益,目前共计加载了4个油田30817口油气井的数据,并取得了良好的工程应用效果。