随着数据库技术的成熟,数据应用的普及,以及互联网的高速发展,人类积累的数据量正在以指数级速度迅速增长。传统的数据分析和查询方法已不能满足人们对隐藏在数据背后知识的迫切需要,在这种信息需求的强劲推动下,知识发现和数据挖掘应运而生,而粗糙集理论作为一门新的数学工具,凭借它不需要附加任何外界信息或先验知识这一特点,突破了其它数据分析工具的局限,避免了人的主观因素对数据挖掘结果的影响,逐渐成为了研究知识发现的重要的数学工具之一。而属性约简是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点,因此本文的重点主要是针对属性约简算法进行改进研究。
首先,本文介绍了经典粗糙集的基本理论和模型及其实际应用,然而经典粗糙集模型的一个局限性是它所处理的分类必须是完全正确的或肯定的,因而它的分类是精确的,即只考虑完全“包含”与“不包含”,而没有某种程度上的“包含”与“属于”,而实际应用中噪声数据又是不可避免的。经典粗糙集模型