基于Winnow算法的垃圾邮件过滤器研究

被引:1
作者
陈峰
机构
[1] 浙江省公安厅科技通信管理局
关键词
垃圾邮件过滤; Winnow算法; Logistic回归;
D O I
暂无
中图分类号
TP393.098 [];
学科分类号
080402 ;
摘要
实现了基本的Winnow算法、Balanced Winnow算法和带反馈学习功能的Winnow算法,并将其成功地应用于大规模垃圾邮件过滤,分别在SEWM2007和SEWM2008数据集上对上述三个算法进行了对比实验。实验结果表明,Winnow算法及其变体在分类效果和效率上都优于Logiistic算法。
引用
收藏
页码:21 / 23+26 +26
页数:4
相关论文
共 8 条
[1]  
文本过滤关键技术研究.[D].夏迎炬.复旦大学.2003, 02
[2]   基于TFIDF的特征选择方法 [J].
王美方 ;
刘培玉 ;
朱振方 .
计算机工程与设计, 2007, (23) :5795-5796+5799
[3]   基于N-gram和向量空间模型的语句相似度研究 [J].
王金铨 ;
梁茂成 ;
俞洪亮 .
现代外语, 2007, (04) :405-413+438
[4]   MIME邮件结构格式分析 [J].
赵英男 ;
张秉权 .
兵工自动化, 2001, (02) :50-53
[5]  
基于贝叶斯的中文垃圾邮件过滤系统的设计与实现.[D].黄志刚.电子科技大学.2007, 03
[6]  
基于内容的垃圾邮件过滤研究.[D].潘文锋.中国科学院研究生院(计算技术研究所).2004, 02
[7]  
统计自然语言处理基础.[M].(美)ChristopherD.Manning;(德)HinrichSchutze著;苑春法等译;.电子工业出版社.2005,
[8]  
Learning quickly when irrelevant attributes abound: A new linear-threshold algorithm.[J].Nick Littlestone.Machine Learning.1988, 4