朴素贝叶斯分类器的研究与应用

被引:0
作者
王国才
机构
[1] 重庆交通大学
关键词
朴素贝叶斯分类器; 特征加权; 贝叶斯网; 粗糙集;
D O I
暂无
年度学位
2010
学位类型
硕士
导师
摘要
朴素贝叶斯分类器是一种简单高效的分类算法,在数据挖掘和模式识别中应用广泛,但是朴素贝叶斯假设在现实中往往不能成立,或多或少都影响了分类的效果。很多分类方法是通过适当放松朴素贝叶斯假设,提高朴素贝叶斯分类器的分类精度,结果通常会导致计算代价的大大提高。 本文主要工作和创新点如下: (1)详细研究了朴素贝叶斯分类器及各种改进模型,通过探讨如何更好的学习朴素贝叶斯分类器,提出了一种基于粗糙集的特征加权朴素贝叶斯分类器,从而提高了朴素贝叶斯分类器的分类性能。 (2)提出一种基于粗糙集的特征加权朴素贝叶斯算法(FWNB)。加权参数直接从属性的粗糙下近似集导出,其可看作是计算每种类别的后验概率时,该属性对此计算的影响程度。将FWNB与朴素贝叶斯分类器(Naive Bayesian classifier, NB)、贝叶斯网(Bayes Networks)和NBTree分类器通过数值实验比较。为了更充分地验证FWNB的有效性,将其与文献26中的基于Rough Set的加权朴素贝叶斯分类器和文献32中的基于粗糙集的朴素贝叶斯分类算法进行了实验对比。 数值实验与对比实验都充分表明:在大多数数据集上,FWNB分类器可在较小的计算代价下,获得较高的分类正确率。 (3)将基于粗糙集的特征加权朴素贝叶斯分类器应用于个人信用的指导中去,验证其分类效果。并与West的神经网络模型以及李旭升等人提出的扩展的树增强朴素贝叶斯网络进行了实验对比,结果表明,FWNB在分类正确率上显著优于其他算法。
引用
收藏
页数:68
共 27 条
[1]
基于粗糙集合和朴素贝叶斯模型的分类问题研究 [D]. 
郭亚光 .
合肥工业大学,
2005
[2]
数据挖掘中基于贝叶斯技术的分类问题的研究 [D]. 
姜卯生 .
合肥工业大学,
2004
[3]
Neural network credit scoring models.[J].David West.Computers and Operations Research.2000, 11
[4]
On the optimality of the simple Bayesian classifier under zero-one loss [J].
Domingos, P ;
Pazzani, M .
MACHINE LEARNING, 1997, 29 (2-3) :103-130
[5]
Bayesian network classifiers [J].
Friedman, N ;
Geiger, D ;
Goldszmidt, M .
MACHINE LEARNING, 1997, 29 (2-3) :131-163
[6]
ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356
[7]
数据挖掘理论与技术.[M].苏新宁等著;.科学技术文献出版社.2003,
[8]
Data Mining: Concepts and Techniques..Han Jiawei; Kanber Micheline;.Higher Education Press.2001,
[9]
一种基于粗糙集的特征加权朴素贝叶斯分类器 [J].
王国才 ;
张聪 .
重庆理工大学学报(自然科学版), 2010, 24 (07) :86-90+105
[10]
基于贝叶斯网络技术的软件缺陷预测与故障诊断 [J].
王科欣 ;
王胜利 .
微型电脑应用, 2009, 25 (11) :31-33+5