基于粗糙集的加权朴素贝叶斯邮件过滤方法

被引:21
作者
邓维斌 [1 ,2 ]
王国胤 [2 ]
洪智勇 [2 ]
机构
[1] 重庆邮电大学电子商务与现代物流重点实验室
[2] 西南交通大学信息科学与技术学院
关键词
垃圾邮件过滤; 特征选择; 粗糙集; 加权朴素贝叶斯;
D O I
暂无
中图分类号
TP393.098 [];
学科分类号
080402 ;
摘要
邮件过滤中有两个关键问题,一是如何选择有效的邮件特征集,二是设计较好的邮件过滤算法。在对邮件特性进行分析的基础上,综合邮件头及邮件内容的主要形象特征给出了一种新的邮件特征集提取方法。用粗糙集的信息观点度量了各属性的重要性,并以此为权重进行加权朴素贝叶斯垃圾邮件过滤,有效地解决了朴素贝叶斯分类中的条件依赖性问题。通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法的有效性。
引用
收藏
页码:218 / 221
页数:4
相关论文
共 6 条
[1]   基于Rough Set的加权朴素贝叶斯分类算法 [J].
邓维斌 ;
王国胤 ;
王燕 .
计算机科学, 2007, (02) :204-206+219
[2]   基于Rough Set的电子邮件分类系统 [J].
李志君 ;
王国胤 ;
吴渝 .
计算机科学, 2004, (03) :58-60+66
[3]   基于条件信息熵的决策表约简 [J].
王国胤 ;
于洪 ;
杨大春 .
计算机学报, 2002, (07) :759-766
[4]  
Rough集理论与知识获取[M]. 西安交通大学出版社 , 王国胤编著, 2001
[5]   A review of machine learning approaches to Spam filtering [J].
Guzella, Thiago S. ;
Caminhas, Walmir M. .
EXPERT SYSTEMS WITH APPLICATIONS, 2009, 36 (07) :10206-10222
[6]  
Rough sets and intelligent data analysis[J] . Information Sciences . 2002 (1)