数据挖掘中基于贝叶斯技术的分类问题的研究

被引:0
作者
姜卯生
机构
[1] 合肥工业大学
关键词
数据挖掘; 贝叶斯理论; 分类规则; 信息熵; 属性组合; 主动学习策略;
D O I
暂无
年度学位
2004
学位类型
硕士
导师
摘要
基于贝叶斯技术的分类是当前数据挖掘领域的一个研究热点。本文从两个方面对贝叶斯分类模型进行了深入的研究:半朴素贝叶斯分类与增量贝叶斯分类。 半朴素贝叶斯分类模型对朴素贝叶斯分类模型的结构进行了扩展,其目的是为了突破朴素贝叶斯分类模型特征属性间独立性假设限制,提高分类性能。目前半朴素贝叶斯分类模型学习的关键是如何有效组合特征属性。针对已有的学习算法中存在的效率不高及部分组合意义不大的问题,本文提出了条件互信息度量半朴素贝叶斯分类学习算法(CMI-BSNBC)。运用实验数据进行了比较实验,实验取得了大量的数据。在分析结果的基础上得出了相应的结论,证明了模型的有效性。 增量贝叶斯分类模型的关键是测试实例的选择策略,本文研究的重点是如何充分利用训练集的先验知识并使其在学习过程中向前传递,提出了新的模型。新模型的基本思想是基于0-1分类损失用训练集对候选测试实例进行检验,这保证了与训练集相容性较好的测试实例被优先选择。
引用
收藏
页数:76
共 13 条
[1]
On the optimality of the simple Bayesian classifier under zero-one loss [J].
Domingos, P ;
Pazzani, M .
MACHINE LEARNING, 1997, 29 (2-3) :103-130
[2]
Bayesian network classifiers [J].
Friedman, N ;
Geiger, D ;
Goldszmidt, M .
MACHINE LEARNING, 1997, 29 (2-3) :131-163
[3]
贝叶斯网模型的学习、推理和应用 [J].
冀俊忠 ;
刘椿年 ;
沙志强 .
计算机工程与应用, 2003, (05) :24-27+47
[4]
主动贝叶斯网络分类器 [J].
宫秀军 ;
孙建平 ;
史忠植 .
计算机研究与发展, 2002, (05) :574-579
[5]
改进学习贝叶斯网络结构的MDL准则 [J].
汪荣贵 ;
张佑生 ;
王浩 ;
姚宏亮 ;
不详 .
计算机工程与应用 , 2002, (08) :207-208
[6]
基于贝叶斯网络的不确定性知识的推理方法 [J].
胡玉胜 ;
涂序彦 ;
崔晓瑜 ;
程乾生 .
计算机集成制造系统-CIMS, 2001, (12) :65-68
[7]
用于决策支持的贝叶斯网络 [J].
王辉 .
东北师大学报(自然科学版), 2001, (04) :26-30
[8]
基于互信息和测度学习信度网结构 [J].
邢永康 ;
沈一栋 .
重庆大学学报(自然科学版), 2001, (01) :78-83
[9]
贝叶斯网络的建造及其在数据采掘中的应用 [J].
林士敏 ;
田凤占 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (01) :49-52
[10]
Bayesian方法的计算学习机制和问题求解 [J].
林士敏 ;
王双成 ;
陆玉昌 .
清华大学学报(自然科学版), 2000, (09) :61-64