网络资源环境面向结构化、语义化和智能化的方向不断地发展,最终目标是实现语义网。近年来,关联数据已经被W3C推荐为语义网的最佳实践,它实质性地促进了面向语义网的网络变革。关联数据的发展和广泛应用使得“数据网络(关联数据网络)”资源环境呈现在我们面前。这一网络资源环境具有明显地特点和优势,并且为人工智能、知识发现等领域的应用提供了巨大地潜力。但如何发挥这些潜力和优势实现知识发现的应用,是当前研究需要解决的问题。
本研究按照文献调研、分析思考、理论研究、应用研究和实践验证的思路,首先识别了基于关联数据的知识发现问题,继而采用综合分析的方法,通过相关基础理论的分析与讨论,解析了基于关联数据的知识发现过程,建立了基于关联数据的知识发现的模型;然后,面向知识发现的应用,分析了基于关联数据的知识发现应用中的主要功能和它们之间的关系,构建了基于关联数据的知识发现应用体系;最后,根据综合分析和应用体系的研究成果,设计了基于关联数据的应用系统模型,并且针对基于关联数据的知识发现应用进行了实验与验证。
基于关联数据的知识发现问题源于充分利用关联数据资源和实现知识发现,以及通过知识发现促进网络发展的双重需求。知识发现活动和关联数据网络的发展需要两个领域的理论和应用体系的融合和扩展。在基于关联数据的知识发现综合体系中,关联数据是数据、是网络资源环境、是数据发现工具,为知识发现注入新的活力;知识发现是一般规律、是解决问题的支点和方法、是关联数据网络资源环境上知识活动的目标,帮助实现关联数据的最佳潜力。
基于关联数据的知识发现问题研究从知识发现理论研究和关联数据应用研究两个方面入手,结合对科学研究的一般规律和应用发展的特殊需求的分析展开。本研究通过对关联数据基本特征和应用特征的分析,识别了关联数据对知识发现的影响和为知识发现提供的潜力,推知了基于关联数据的知识发现的基本特征和潜力;根据特征的分析,结合知识发现的一般规律,分析了基于关联数据的知识发现过程,并且在此基础上,进一步分析和构建了基于关联数据的知识发现模型。
知识发现与关联数据都是重要的实践方法,二者结合的目标也在于指导新的网络环境下的知识发现活动,因此相关应用体系的研究具有重要的实践意义。本研究分析了基于关联数据的知识发现的主要任务,从而构建了综合应用体系模型。通过应用体系,明确了基于关联数据的知识发现应用的层次、结构、目标、主要功能以及各要素之间的关系。
在基本规律分析和应用体系研究基础上,本研究进行了基于关联数据的知识发现应用系统原型的设计,并且根据原型进行了系统实现与验证。应用系统原型设计充分利用了理论分析和应用体系研究的成果,提出了一个以模式整合为核心的应用系统模型,能够更好地支持基于关联数据的知识发现活动。
本研究构建了以关联数据为底层支撑和逻辑控制,以知识发现作为流程和结构的控制,以关联数据的应用功能为关键操作控制的基于关联数据的知识发现模型。该模型抽象了基于关联数据的知识发现活动的新规律。本研究也面向知识发现的应用和实现,分析和构建了基于关联数据的知识发现应用体系,这一体系可以作为整合已有研究和应用成果和未来相关工作的框架。在基本规律分析和应用体系研究的基础上,本研究设计了基于关联数据的知识发现应用系统的原型。原型设计可以作为知识发现系统开发的框架,并且为相关研究工作提供借鉴。根据研究的结果,本研究组织了实验环境并且实现了基于关联数据的知识发现实验系统,并且使用系统实现了关联数据挖掘和关联规则的发现,验证了本研究的理论和系统设计框架及部分功能。
基于关联数据的知识发现研究延伸了知识发现研究的理论体系,同时也加强了关联数据的应用研究。通过综合分析和研究揭示了基于关联数据的知识发现的新规律,为未来的应用开发和实践提供了基础和借鉴。本研究的目标是解析关联数据对于知识发现效率和能力的影响,实现关联数据背景下的知识发现。同时促进二者之间的相辅相成和不断优化,实现对关联数据发展乃至语义网发展的促进。