云计算在基于贝叶斯分类的垃圾短信过滤中的研究与应用

被引:0
作者
朱杰
机构
[1] 电子科技大学
关键词
垃圾短信; 云计算; 贝叶斯分类; MapReduce;
D O I
暂无
年度学位
2010
学位类型
硕士
导师
摘要
手机短信依靠移动性强、收发便捷、资费低等优势,已逐渐成为人们重要的沟通工具。手机用户数量的不断增加推着短信发送数量呈几何级数上升。垃圾短信的问题也因此突显出来,不仅对人们的正常生活造成了诸多的不良影响,还对公共安全和社会稳定造成了一定程度的危害。因此对垃圾短信准确过滤显得尤其重要。经过研究发现,现有的短信过滤技术存在一些不足;基于黑白名单的过滤技术显得过于简单粗暴,基于内容分析技术虽然准确度得到很大程度的提高,但在实现上也存在着复杂度过高、易导致信息网络阻塞等不足。 研究发现基于内容过滤技术的不足之处在于计算能力跟不上,而不是方法不正确。针对上述过滤技术的缺点,本文详细调查分析了这两年飞速发展起来的云计算技术,发现其技术在伸缩性、可靠性、成本等方面具有非常大的优势。特别需要指出的是依靠它的高扩展能力可以把计算规模做到无限大,而且成本又非常低,故可以作为不错的计算平台。有这个基础,本文接着分析了现行基于内容过滤器所使用的算法,发现大部分方案是基于贝叶斯分类原理来实现的。经过研究贝叶斯分类算法基础,并做了大量相关实验,发现其可以在云计算平台上通过MapReduce编程模型来实现。 本文主要工作如下: (1)深入分析正在使用的垃圾短信过滤的实现方案,对各过滤实现方式的原理及其性能做仔细分析比较 (2)分析了云计算技术各种应用,重点对云计算的Hadoop开源实现方案中的MapReduce编程模型做深入的研究。 (3)对于贝叶斯分类器的基础原理及相应的算法实现做了详细的研究,根据其算法特点提出了基于云计算的贝叶斯分类器方案。 (4)基于开源的Hadoop的云计算实现方案构建了基于贝叶斯分类的短信过滤器,并对其实现做了详细的论述。
引用
收藏
页数:73
共 14 条
[1]
基于文本挖掘的垃圾短信过滤方法 [D]. 
钟延辉 .
电子科技大学,
2009
[2]
智能手机多功能防火墙模型设计 [D]. 
侯晓宝 .
电子科技大学,
2009
[3]
Boosting算法研究 [J].
路刚 ;
陈永 ;
范永欣 ;
胡成 .
电脑知识与技术, 2008, 4 (36) :2698-2699+2708
[4]
垃圾短信的防治方法研究 [J].
何培舟 ;
温向明 ;
郑伟 .
通信技术, 2008, 41 (12) :340-342+346
[5]
垃圾短信综合治理的困境与抉择 [J].
张淑亚 ;
周书霞 .
经济研究导刊, 2008, (17) :110-111
[6]
垃圾短信的防范与治理 [J].
梁作君 .
通信管理与技术, 2008, (03) :5-7+16
[7]
论垃圾广告短信的危害与治理对策 [J].
龚国伟 .
图书馆, 2008, (03) :100-101
[8]
试论文本挖掘及其应用 [J].
肖建国 .
图书馆学研究, 2008, (04) :22-24
[9]
垃圾短信监控的原理与实现 [J].
易阳锋 .
中兴通讯技术, 2005, (06) :49-54
[10]
中文文本分类中的特征选择算法研究 [J].
胡佳妮 ;
徐蔚然 ;
郭军 ;
邓伟洪 .
光通信研究, 2005, (03) :44-46