空间数据挖掘是指从空间数据库中抽取隐含知识、空间关系或非显式存储在数据库中有意义的特征或模式。该技术在理解空间数据、获取空间与非空间数据间内在关系方面具有重要意义。由于近年来空间地理信息系统(Geography Information System,GIS)广泛地应用到各个行业中,积累大量与空间位置相关的空间数据,因此空间数据挖掘研究已成为当前研究的重要课题。
本论文系统地讨论空间数据挖掘的基本理论,提出GIS中空间数据挖掘系统体系结构和能挖掘多种空间知识类型的多种空间数据挖掘算法,实现一个GIS中空间数据挖掘原型系统——GISMiner,论文研究成果可归纳如下:
(1)进一步完善空间数据挖掘的理论和技术框架,对其所涉及的问题与方法进行系统的分析和阐述,为全文的研究提供理论基础和方法指导。提出一种包括数据源、挖掘器、用户界面三层结构的空间数据挖掘体系结构并分析其各模块及基本步骤,阐述从空间数据库中能发现的知识类型。研究空间数据挖掘的方法并阐述各种方法的特点和适用范围,指出空间数据挖掘中的知识可用多种知识表达方法。
(2)研究属性相关下空间离群点挖掘实施模式,介绍离群数据和离群数据挖掘的定义,描述离群数据中的四种主要发现方法,并且研究离群算法在CAD中的实施情况。在空间统计学的基础上,引用属性相关性矩阵理论和R-tree动态索引结构来搜索空间离群点,从而提出多属性相关的空间离群数据挖掘方法,分别从某型摩托车前灯外覆盖件数据和杭州地学数据两方面进行性能分析。
(3)提出空间分类同位规则的方法,首先介绍经典的关联规则,空间关联规则,基于规则空间同位方法,研究基于向量数据的同位规则算法,根据空间关系定义数据挖掘中事务的概念,采用多层参与索引,搜索空间同位规则,从而实现对空间分类数据有效地处理,算法对杭州地区119火灾数据进行试验,并验证算法的适用范围和性能。试验表明,算法可以有效地处理经过离散化后的连续数据。
(4)研究空间同位时序分析的方法,首先介绍经典的时序分析技术,在此基础上分析当今事件序列模式挖掘的方法和应用范围,从而根据事件分布的实际情况,综合序列、同位、关联规则技术提出时序空间同位的算法,通过设置事件重叠窗口,来分析时序序列,对其进行时间复杂度和试验分析,结果显示这种方法能够有效地提取时空相关的知识。
(5)在GIS的基础上,实现空间数据挖掘的原型系统,它具有灵活开放的结构,能够挖掘空间特征、关联及分类等多种知识类型的规则。最后通过在杭州119系统数据上的应用,验证系统的可行性。