基于Spark平台和并行随机森林回归算法的短期电力负荷预测

被引:31
作者
刘琪琛 [1 ]
雷景生 [2 ]
郝珈玮 [2 ]
黄燕刚 [1 ]
李强 [1 ]
罗海波 [1 ]
机构
[1] 国网四川省电力公司眉山供电公司
[2] 上海电力学院计算机科学与技术学院
关键词
电力大数据; 分布式计算; 并行随机森林回归算法; Spark平台; 短期电力负荷预测;
D O I
暂无
中图分类号
TM715 [电力系统规划];
学科分类号
080802 ;
摘要
随着智能电网、全球能源互联网的建设与相关技术的发展,现代电力系统中电力大数据的格局已经形成,如何对高维海量数据进行深度挖掘以实现数据的充分利用,成为当前电力工作者们关心的问题。该文针对电力大数据环境下高精度和实时性的负荷预测展开了研究,提出了基于Spark平台和并行随机森林回归算法(Spark platform and parallel random forest regression,SP-RFR)的短期电力负荷预测方法,通过3次弹性分布式数据集(resilient distributed datasets,RDD)转换实现单机随机森林算法的并行化改进,并在Spark分布式集群环境下实现部署。结合某区域实际电力负荷数据设计试验,进行模型训练和回归预测,通过试验证明,对同等的数据集,基于Spark平台的并行随机森林回归算法预测精度高于单机负荷预测算法;并行随机森林算法受离群数据干扰较小,且随着数据集的增大,并行随机森林算法表现出良好的鲁棒性;与单机算法在运行时间上相比,随着数据集的增大,基于分布式集群的方法优势明显。该文提出的方法能够有效地在分布式环境中进行电力负荷预测,为负荷预测提供了一种新思路。
引用
收藏
页码:84 / 92
页数:9
相关论文
共 19 条
[1]  
基于模糊神经网络的电力系统短期负荷预测.[D].陈科.东南大学.2015, 05
[2]  
基于Spark的大数据挖掘技术的研究与实现.[D].李文栋.山东大学.2015, 02
[3]  
集群计算引擎Spark中的内存优化研究与实现.[D].冯琳.清华大学.2013, 07
[4]  
基于决策树的电力负荷预测模型研究.[D].皮志贤.华北电力大学(北京).2011, 09
[5]  
智能电网技术.[M].刘振亚; 主编.中国电力出版社.2010,
[6]  
小波分析及其在电力系统中的应用.[M].任震等著;.中国电力出版社.2003,
[7]  
灰色预测模型及中长期电力负荷预测应用研究.[D].王大鹏.华中科技大学.2013, 02
[8]   智能电网中大数据的概念、技术与挑战 [J].
王钦 ;
蒋怀光 ;
文福拴 ;
梅天华 .
电力建设, 2016, 37 (12) :1-10
[9]   基于Spark的大电网广域时空序列分析平台构建 [J].
袁宝超 ;
刘道伟 ;
刘丽平 ;
王泽忠 .
电力建设, 2016, 37 (11) :48-54
[10]   基于Spark的并行SVM算法研究 [J].
刘泽燊 ;
潘志松 .
计算机科学, 2016, 43 (05) :238-242