粗糙集属性约简算法在数据挖掘中的研究

被引:0
作者
于兴网
机构
[1] 重庆大学
关键词
数据挖掘; 粗糙集; 属性约简; 可辨识矩阵;
D O I
暂无
年度学位
2004
学位类型
硕士
导师
摘要
随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要。粗糙集理论(Rougll Sets)就是在这样背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理的新型数学理论。粗糙集理论也凭借其独特的优势而在KDD领域中具有越来越重要的地位。 属性约简是粗糙集理论研究的核心问题之一,本文首先介绍了Pawlak粗糙集模型以及决策表、可辨识矩阵和约简等基本概念,为后面章节中的属性约简算法打下了理论基础。 现已证明,寻找一个决策表的最小约简是NP-难问题,在人工智能中,解决这类问题的方法一般是使用启发式算法。 本文把属性重要性作为启发式信息,以核属性为寻求约简的起点,通过对算法中加入启发式信息,减少了搜索空间。给出了相对可辨识矩阵的概念,并以相对可辨识矩阵为基础,对属性约简的基本算法做出了改进,把本来是对可辨识矩阵进行逻辑运算的计算转化成代数运算,在一定程度上简化了计算,提高了约简效率。后面又提到了基于信息熵的相对属性约简算法。并在文章的最后提出了一种新的基于灰色关联度的属性约简算法,实验证明,该算法可以获得令人满意的约简。
引用
收藏
页数:56
共 21 条
[1]
关于粗糙集理论与信息熵的几点注记 [J].
胡丹 ;
莫智文 .
四川师范大学学报(自然科学版), 2002, (03) :257-260
[2]
属性约简自寻优算法 [J].
潘丹 ;
郑启伦 ;
不详 .
计算机研究与发展 , 2001, (08) :904-910
[3]
数据挖掘综述 [J].
钟晓 ;
马少平 ;
张钹 ;
俞瑞钊 .
模式识别与人工智能, 2001, 14 (01) :48-55
[4]
一种基于Rough Set理论的属性约简及规则提取方法 [J].
常犁云net王国胤net吴渝net .
软件学报, 1999, (11) :0-0+0
[5]
数据采掘与知识发现:回顾和展望 [J].
郑之开 ;
张广凡 ;
邵惠鹤 .
信息与控制, 1999, (05) :357-365
[6]
在KDD和DataMining中我们的部分工作和看法 [J].
覃振兴 ;
袁曾任 .
信息与控制, 1999, (04) :255-261
[7]
知识约简的一种启发式算法 [J].
苗夺谦 ;
胡桂荣 .
计算机研究与发展 , 1999, (06)
[8]
粗糙集理论及其应用综述 [J].
韩祯祥 ;
张琦 ;
文福拴 .
控制理论与应用, 1999, (02) :153-157
[9]
基于Rough Set理论的“数据浓缩” [J].
王珏 ;
王任 ;
苗夺谦 ;
郭萌 ;
阮永韶 ;
袁小红 ;
赵凯 .
计算机学报, 1998, (05) :393-400
[10]
Analysis on Attribute Reduction Strategies of Rough Set.[J].王珏;苗夺谦.Journal of Computer Science and Technology.1998, 02