随着数据库技术的不断发展及其广泛应用,数据库中的数据量急剧增大,当大量数据不停地被收集和存储,业界人士对他们数据中项集之间的相关联系越来越感兴趣。这种数据中项集之间的有趣的相关联系称为关联规则。如今,关联规则已广泛应用于各个领域,如:医疗诊断,市场分析等。而算法效率不高、规则冗余度较大、用户仅对一部分关联规则感兴趣是目前关联规则挖掘算法普遍存在的问题,因此,从大量的数据中迅速挖掘用户感兴趣的关联规则,具有重要的现实意义。而银行的电子化经过了十多年的建设,各银行业务系统都已取得了一定的成绩。面对庞大的数据库及众多的数据,业内人士往往感到无所适从,不知道如何把这些数据利用起来。
本论文的研究工作,主要围绕着基于粗糙集理论的动态约简以求得决策规则。利用粗糙集理论的基本原理,挖掘出用户需要的决策规则。
本文主要研究了以下几个方面的内容:
(1)一种改进的属性约简算法;
(2)将属性约简算法与其他算法结合在一起使用。
论文首先概述了集合和粗糙集理论的基础知识,通过对粗糙集理论的研究,阐明了粗糙集理论是一种尤为适用于不确定、不完整系统的数据挖掘的数学工具。在此基础上,重点探讨了粗糙集理论的属性约简方法。最后,阐述了基于粗糙集理论的关联规则挖掘的改进算法,并详细说明了改进的关联规则挖掘算法及其步骤。并将其作用于实验数据库,获得了较好的结果,证实了原型系统具有一定的实用价值。
本文的研究工作是一个尝试,有待于进一步的深入研究。