基于粗糙集合和朴素贝叶斯模型的分类问题研究

被引:0
作者
郭亚光
机构
[1] 合肥工业大学
关键词
KDD; 粗糙集合; 约简; 朴素贝叶斯; 分类;
D O I
暂无
年度学位
2005
学位类型
硕士
导师
摘要
KDD是在数据库和人工智能的相互融合渗透中逐渐发展起来的一个有着广 阔应用前景的新兴研究领域,是从数据中提取人们感兴趣的、潜在的、可用的知 识,并表示成用户可理解的形式。分类是KDD领域中重要的研究分支。 由波兰数学家Pawlak提出的料糙集合理论是一种表示和处理不确定性知识 的方法,在KDD领域中具有越来越重要的地位。朴素贝叶斯分类技术是以贝叶斯 定理、最大后验假设等理论为基础,其分类模型由于简单、易于实现而受到普遍 青睐。 本文对基于粗糙集合和朴素贝叶斯的分类问题进行了研究,主要包括以下几 个方面的内容: 研究了不完备信息系统中粗糙集合理论的扩展,提出了一种基于属性重要度 的粗集扩展模型。 将粗糙集合理论引入朴素贝叶斯分类模型的研究中,提出了基于信息熵的近 似属性约简算法(MAIR),改善条件属性间的依赖关系,最大程度上满足朴素贝叶 斯分类条件独立性假设的要求。 在MAIR算法的基础上提出了基于粗糙集合理论的朴素贝叶斯分类算法 (RSBC),实验证明,该算法在分类正确率上优于朴素贝叶斯分类算法。
引用
收藏
页数:66
共 17 条
[1]
朴素贝叶斯分类器增量学习序列算法研究 [J].
姜卯生 ;
王浩 ;
姚宏亮 .
计算机工程与应用, 2004, (14) :57-59
[2]
不完备信息系统中基于联系度的粗集模型拓展 [J].
黄兵 ;
周献中 .
系统工程理论与实践, 2004, (01) :88-92
[3]
Rough集理论在不完备信息系统中的扩充 [J].
王国胤 .
计算机研究与发展, 2002, (10) :1238-1243
[4]
一种增量贝叶斯分类模型 [J].
宫秀军 ;
刘少辉 ;
史忠植 .
计算机学报, 2002, (06) :645-650
[5]
数据挖掘技术初探 [J].
周晓宇 ;
李慎之 ;
戚晓芳 ;
徐宝文 .
小型微型计算机系统, 2002, (03) :342-346
[6]
数据挖掘与知识发现的理论方法及技术分析 [J].
肖攸安 ;
李腊元 .
交通与计算机, 2002, (01) :57-61
[7]
增强型朴素贝叶斯学习 [J].
王实 ;
高文 .
计算机科学, 2000, (04) :46-49
[8]
知识约简的一种启发式算法 [J].
苗夺谦 ;
胡桂荣 .
计算机研究与发展 , 1999, (06)
[9]
粗糙集理论中概念与运算的信息表示 [J].
苗夺谦 ;
王珏 .
软件学报, 1999, (02)
[10]
大规模数据库中的知识获取 [J].
丁德恒 .
计算机科学, 1994, (05) :48-50