基于大数据的网络恶意流量分析系统的设计与实现

被引:0
作者
刘肖琛
机构
[1] 北京邮电大学
关键词
大数据; 恶意流量; 僵尸网络; Hadoop; 复合会话;
D O I
暂无
年度学位
2015
学位类型
硕士
导师
摘要
本文主要研究了大数据时代下的网络恶意流量的分析与检测。本文提出了关于一种网络行为分析监控系统的设计与实现。整个系统中共分为采集部分、蜜罐系统、Hadoop处理平台以及呈现服务器四个部分。采集探针模块负责从数百个中型企业的网络出口端采集数据包,所有的数据包通过探针内部程序预处理后上传到采集服务器中。而Hadoop平台作为数据整合和数据分析的平台则要定时从采集服务器中下载当天的数据,缓解采集服务器中数据存储的压力,从采集服务器中下载的数据格式固定,以文本文件的形式存在HDFS中。搭建的蜜罐网则主要负责收集网络中的各种木马,僵尸病毒,并从中提取出这些木马,僵尸病毒的特征,传入Hadoop平台中进行分析。而Hadoop平台的处理以及分析结果将在呈现服务器中以图表的形式进行展示。本文搭建的蜜罐系统是一个闭环的结构,他主要负责吸引网络中的各种恶意流量,同时通过本文提出的可疑URL选取算法对流量数据进行初步分析并获得一个可疑URL列表。 本文还提出了一种恶意流量检测方法。所有的工作与闭环蜜罐系统一起集成为一个网络行为分析监测系统,可以有效地和精确地检测异常行为。本文提到的基于复合会话的数据采集算法很好地解决了探针内存不足的限制,复合会话是一个由src、dst、网络协议和目标端口四元组唯一标识的实体。为了消除数据采集的负面影响,本文还依托于MapReduce的框架提出了数据处理的算法。最后本文提出一个识别异常流量的三步算法:数据过滤,域名匹配和网络节点排除。首先识别网络流量中具有周期性行为的复合会话,然后通过对比白名单等手段去除一些错判对象得到最终的检测结果。
引用
收藏
页数:65
共 27 条
[1]
僵尸网络异常流量分析与检测 [D]. 
王新良 .
北京邮电大学,
2011
[2]
僵尸网络.[M].(美) 席勒 (Schiller;C.A.) 等; 著.科学出版社.2009,
[3]
第三代蜜网技术在校园网络安全防御体系中的应用研究 [J].
张洁 .
数字化用户, 2013, 19 (12) :48
[4]
大数据环境下的数据安全研究 [J].
李洪洋 .
电子技术与软件工程, 2013, (20) :250
[5]
大数据环境下的网络安全分析 [J].
陈建昌 .
中国新通信, 2013, 15 (17) :13-16
[6]
大数据环境下的数据安全研究 [J].
郭三强 ;
郭燕锦 .
科技广场, 2013, (02) :28-31
[7]
大数据时代面临的信息安全机遇和挑战 [J].
冯伟 .
中国科技投资, 2012, (34) :49-53
[8]
互联网管理的“中国模式”及世界影响 [J].
阚道远 .
学术探索, 2012, (09) :113-117
[9]
大数据背景下运营商移动互联网发展策略研究 [J].
顾芳 ;
刘旭峰 ;
左超 .
邮电设计技术, 2012, (08) :21-24
[10]
当前企业网络安全的威胁因素及对策研究 [J].
李志刚 ;
王光旭 .
计算机光盘软件与应用, 2012, 15 (16) :86+88