反垃圾邮件技术的研究

被引:0
作者
詹川
机构
[1] 电子科技大学
关键词
垃圾邮件; 过滤; 贝叶斯算法; 学习向量量化网络; 特征;
D O I
暂无
年度学位
2005
学位类型
博士
导师
摘要
伴随着Internet的普及,电子邮件以其快捷、方便、低成本的特点已成为互联网上最重要、最普及的应用。但是随之而来的垃圾邮件也越来越泛滥,占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作,生活和学习。如何有效地治理垃圾邮件问题是全世界共同面临的一道难题,也是互联网上目前急待解决的问题。 本文从技术的角度出发,在全面系统学习和总结了国内外反垃圾邮件领域的最新成果的基础上,深入细致地研究了反垃圾邮件技术,取得了以下若干创新和成果。 本文的主要创新和贡献包括: 1、归纳总结了当前垃圾邮件采用的新的抗过滤的方法和手段。垃圾邮件发送者为了让垃圾邮件逃避各种垃圾邮件过滤,不断变化更新欺骗过滤器的方法和手段,目前简单的过滤方法已经无法有效地过滤垃圾邮件。本文在学习了国内外相关资料和研究了大量近期垃圾邮件样本后,归纳总结了当前垃圾邮件发送者常采用的欺骗手段和方法,及其它们的特点,以便有的放矢,更有效地反垃圾邮件。 2、提出了一种基于内容的MNNB垃圾邮件过滤算法。MNNB算法应用Markov链改善了Na(?)ve Bayes垃圾邮件过滤算法中的词条之间相互独立的缺陷,并假设句与句之间是独立的,来简化算法的计算量。实验显示MNNB算法提高了Na(?)ve Bayes算法的准确率和查全率,并且由于该算法不需要分词,对过滤不同语言的垃圾邮件具有更好的适应性。 3、提出了一种基于内容的LVQ神经网络过滤算法。LVQ神经网络算法是先把邮件细分成具体的类别,然后再根据用户的定义,把具体的类别规约成垃圾类邮件和正常类邮件。LVQ神经网络算法克服了垃圾邮件具体类别宽泛,特征离散的问题,提高了垃圾邮件识别的准确度,并且该算法可根据用
引用
收藏
页数:138
共 17 条
[1]
中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32
[2]
一种高效的智能内容过滤模型 [J].
朱骏 ;
陈刚 .
计算机工程, 2003, (21) :146-148
[3]
基于数据挖掘的垃圾E-mail过滤方法 [J].
李文斌 ;
刘椿年 ;
黄佳进 .
北京工业大学学报, 2003, (02) :237-240
[4]
邮件过滤器系统的设计与实现 [J].
沈卫超 .
信息与电子工程, 2003, (02) :18-21
[5]
电子邮件过滤系统的粗糙集分析模型 [J].
于洪 ;
李志君 ;
唐宏 ;
吴中福 .
计算机工程与应用, 2003, (15) :47-48+67
[6]
垃圾邮件的智能过滤系统设计探讨 [J].
刘洋 ;
杜孝平 ;
黄星华 ;
侯志辉 ;
郭晨 ;
周二胜 ;
骆焕林 .
微机发展, 2003, (04) :1-3
[7]
基于DNS Blocklist的反垃圾邮件系统的设计与实现 [J].
杨峰 ;
曹麒麟 ;
段海新 ;
李星 .
计算机工程与应用, 2003, (07) :11-12+45
[8]
一种基于机器学习的垃圾邮件智能过滤方法 [J].
周威成 ;
马素霞 ;
齐林海 .
现代电力, 2003, (01) :65-67
[9]
个人化电子邮件自动过滤系统的设计 [J].
谭立球 ;
谷士文 ;
费耀平 .
计算机应用, 2002, (06) :54-55
[10]
近似镜像网页检测算法的研究与评价 [J].
王建勇 ;
谢正茂 ;
雷鸣 ;
李晓明 .
电子学报, 2000, (S1) :130-132+129