基于Boosting算法的垃圾邮件过滤方法研究

被引:7
作者
柴宝仁 [1 ]
谷文成 [2 ]
牛占云 [3 ]
周宏君 [4 ]
王克生 [2 ]
机构
[1] 齐齐哈尔大学应用技术学院
[2] 齐齐哈尔大学网络信息中心
[3] 北京首都国际机场股份有限公司
[4] 林甸县第一中学
关键词
Boosting算法; 垃圾邮件; 过滤; 分类器; 评价;
D O I
10.15918/j.tbit1001-0645.2013.01.010
中图分类号
TP393.098 [];
学科分类号
080402 ;
摘要
为解决垃圾邮件过滤的精确度和有效性问题,提出了一种基于邮件内容过滤的垃圾邮件过滤方法,该方法采用Boosting算法构造了一种垃圾邮件过滤器,利用该垃圾邮件过滤器实现对垃圾邮件的过滤.本文借鉴文本分类和信息检索领域所使用的评价指标,构建了垃圾邮件过滤器的评价体系,利用该评价体系,针对基于Boosting算法所构造的垃圾邮件过滤器对垃圾邮件的过滤实验所得到的数据进行了测试和评估,测试和评估的结果验证了Boosting算法在垃圾邮件过滤中的有效性,其性能优于传统的贝叶斯算法.
引用
收藏
页码:79 / 83
页数:5
相关论文
共 6 条
[1]   基于内容过滤的个性化搜索算法 [J].
曾春 ;
邢春晓 ;
周立柱 .
软件学报, 2003, (05) :999-1004
[2]   基于DNS Blocklist的反垃圾邮件系统的设计与实现 [J].
杨峰 ;
曹麒麟 ;
段海新 ;
李星 .
计算机工程与应用, 2003, (07) :11-12+45
[3]   Boosting methods for regression [J].
Duffy, N ;
Helmbold, D .
MACHINE LEARNING, 2002, 47 (2-3) :153-200
[4]   A decision-theoretic generalization of on-line learning and an application to boosting [J].
Freund, Y ;
Schapire, RE .
JOURNAL OF COMPUTER AND SYSTEM SCIENCES, 1997, 55 (01) :119-139
[5]   THE STRENGTH OF WEAK LEARNABILITY [J].
SCHAPIRE, RE .
MACHINE LEARNING, 1990, 5 (02) :197-227
[6]  
基于内容的垃圾邮件过滤研究.[D].潘文锋.中国科学院研究生院(计算技术研究所).2004, 02