基于时间序列模型的网络流量预测研究

被引:0
作者
朱苗苗
机构
[1] 西安工程大学
关键词
异常值; 数据预处理; 时间序列; FARIMA模型; 长记忆;
D O I
暂无
年度学位
2017
学位类型
硕士
导师
摘要
随着互联网的快速发展,当前网络的环境越来越复杂。这就意味着网络服务和质量就容易出现问题,网络的性能就越容易受到影响。广电网络三网融合背景下,我国广播电视网络公司为提升市场竞争力,需要对现有网络资源进行整合和改造,因此,构建一个针对面向广电业务运营、具备网络设备综合管控能力的网络综合管理系统是目前面向广电行业发展中亟待解决的问题。Internet/SNMP网络管理体系是目前应用最为广泛的网络管理体系框架,适应性和扩展性强。广电网络规模巨大,结构复杂,网络的故障维护和健康管理对于提升网络的运营能力至关重要。因此,针对广电网络运维工作复杂、资源调度困难、网络运行监视消耗资源大的这些特性,本文将利用时间序列模型对湖南广播电视网络运维中的网络流量数据进行分析和预测。传统的用来预测流量数据的模型有Markov过程、泊松过程、AR模型、MA模型、ARMA模型、ARIMA模型等,这些模型用来处理短相关的时间序列具有很好的效果,但是不能对具有长记忆特征的网络流量数据进行有效的拟合和预测。因此,寻找并研究更适合的模型具有重要意义。FARIMA模型是由Hurst指数和ARIMA模型构成,是ARIMA模型的延伸,具备了长相关特征,能够利用参数Hurst指数来处理网络流量数据的长记忆部分,因此,可以认为FARIMA模型特别合适作为网络流量数据的研究模型。尽管模型选择好了,但在拟合的过程中总会有一些错误出现,导致预测结果存在误差,经过多次仿真实验和查阅资料之后发现,网络流量存在突发性,原始数据的质量存在很大的问题,这就导致我们在模型的拟合过程中常常会出现白噪声检验不通过,参数因子不显著,预测结果不准确等诸多问题最后导致实验失败。因此,找到合适的算法以提升数据的质量问题是模型正确拟合的关键。本文的主要工作是前两章详细介绍了FARIMA模型的理论基础和研究内容,分析了FARIMA模型具有的自相似、长相关等重要特性,也正是因为FARIMA模型所具有的这些特性解决了长记忆性的网络流量数据的预测问题,为流量预测奠定了一个很好的基础。其次,为了解决网络流量数据的质量问题,本文在第三章提出了两个异常值处理算法,一个是缺失值填补算法,另一个是异常值剔除算法,并利用了湖南广电的核心路由器的几个端口的数据进行了仿真实验,实验结果证明数据质量检验算法提高了数据的精确度,减小了数据误差,使得原始数据信息更加完整,拟合模型更加准确。第四章,将异常数据检验算法结合FARIMA模型对湖南广电的真实数据进行了一次完整的拟合,结果表明带有数据质量检验的FARIMA模型的拟合模型更加精确,具有更强的数据预测能力。为未来的网络流量预测奠定了坚实的模型基础。最后一章对全文的研究内容和算法做了总结,指出了目前研究的内容还存在的不足之处,展望了以后需要研究的方向。
引用
收藏
页数:66
共 33 条
[1]
时间序列挖掘相关算法研究及应用 [D]. 
杜奕 .
中国科学技术大学,
2007
[2]
应用时间序列分析.[M].王燕; 编著.中国人民大学出版社.2008,
[3]
数字信号处理.[M].胡广书编著;.清华大学出版社.2003,
[4]
基于Alpha值预测的投资模型研究 [D]. 
钱明凤 .
华南理工大学,
2015
[5]
面向数据驱动建模的数据预处理方法研究 [D]. 
任志伟 .
河南科技大学,
2013
[6]
基于聚类分析的缺失数据填补算法研究 [D]. 
张赤 .
武汉轻工大学,
2013
[7]
基于FARIMA模型的网络流量建模与预测 [D]. 
苏占波 .
电子科技大学,
2010
[8]
时间序列分析在吉林省GDP预测中的应用 [D]. 
刘薇 .
东北师范大学,
2008
[9]
自相似业务流的预测研究 [D]. 
程红霞 .
电子科技大学,
2006
[10]
Neural Networks:Tricks of the Trade 2..Lukosevicius; M;.Springer.2012,