基于改进Nave Bayes的垃圾邮件过滤模型研究

被引:12
作者
王涛
裘国永
何聚厚
机构
[1] 陕西师范大学计算机科学学院
关键词
垃圾邮件过滤; 朴素贝叶斯; 期望交叉熵; 特征选取;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TP393.098 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 080402 ;
摘要
分析了目前在垃圾邮件过滤中广泛应用的NaveBayes过滤模型(NBF),指出了期望交叉熵(ECE)特征词选取方法的不足。提出了改进的NaveBayes垃圾邮件过滤模型(A-NBF),用改进的期望交叉熵(AECE)选取垃圾邮件特征词,并在邮件分类过程中对特征词进行加权,从而提高对垃圾邮件过滤的精度。实验结果可以看出A-NBF比NBF在过滤精度方面有明显的提高。
引用
收藏
页码:186 / 190
页数:5
相关论文
共 3 条
[1]   基于结构特征的nBayes双层过滤模型 [J].
王斌 ;
许洪波 ;
王申 .
计算机应用, 2006, (01) :191-194
[2]   中文文本分类中的特征选择算法研究 [J].
胡佳妮 ;
徐蔚然 ;
郭军 ;
邓伟洪 .
光通信研究, 2005, (03) :44-46
[3]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101