一种电力设备状态监测大数据的分布式联机分析处理方法

被引:28
作者
王德文
周青
机构
[1] 华北电力大学控制与计算机工程学院
关键词
状态监测; 大数据; 关系型联机分析; 数据模型; 层次编码;
D O I
10.13334/j.0258-8013.pcsee.151863
中图分类号
TM732 [电力系统的运行]; TP311.13 [];
学科分类号
1201 ;
摘要
电力设备状态监测大数据分析是一个热点研究课题,对保障电力设备的安全稳定运行具有重要意义。联机分析处理(on-line analytical processing,OLAP)可以多角度、快速存取与分析数据,是实现电力设备状态监测大数据分析的一种重要技术手段。通过分析大数据环境下的OLAP技术,设计一种电力设备状态监测大数据分析平台,给出3种分布式数据分析方案,包括基于Hive的关系型联机分析、基于Impala的关系型联机分析和基于HBase的多维联机分析。分布式关系型联机分析虽然在一定程度上满足电力企业的需求,但其数据模型中表之间频繁的连接操作,导致其出现性能瓶颈。针对分布式关系型联机分析数据模型连接操作开销大、查询速度慢等问题,提出了基于无连接层次编码的电力设备状态监测数据模型,对常规数据模型进行改进,把维表的层次信息进行编码存储到事实表中,减少连接操作,以优化性能。采用Hive和Impala等大数据分析工具,在不同规模监测数据集上对本模型的数据加载、上卷操作、存储开销等方面进行实验测试。实验结果表明,数据加载速度约是常规模型的42%,上卷执行时间比常规数据模型缩短40%至49%,存储开销大约比常规星型模型减少37%,验证了本方法的有效性与可行性,给电力设备状态监测大数据分析带来一种新的思路。
引用
收藏
页码:5111 / 5121+5392 +5392
页数:12
相关论文
共 24 条
  • [11] 基于Hive架构的电力设备状态信息数据仓库的研究[D]. 肖凯.华北电力大学. 2013
  • [12] 基于OLAP技术的业务流程多维数据模型分析[D]. 张亮.北京交通大学. 2012
  • [13] 开源大数据分析引擎Impala实战[M]. 清华大学出版社 , 贾传青, 2015
  • [14] Hadoop权威指南[M]. 清华大学出版社 , (美) 怀特 (White, 2011
  • [15] 数据库系统概论[M]. 高等教育出版社 , 王珊, 2006
  • [16] HaoLap:基于Hadoop的海量数据OLAP系统
    郭朝鹏
    王智
    韩峰
    张一川
    宋杰
    [J]. 计算机研究与发展 , 2013, (S1) : 378 - 383
  • [17] 智能变电站海量在线监测数据处理方法
    王德文
    肖磊
    肖凯
    [J]. 电力自动化设备, 2013, 33 (08) : 142 - 146+156
  • [18] 支持大数据管理的NoSQL系统研究综述
    申德荣
    于戈
    王习特
    聂铁铮
    寇月
    [J]. 软件学报, 2013, 24 (08) : 1786 - 1803
  • [19] 智能电网大数据处理技术现状与挑战
    宋亚奇
    周国亮
    朱永利
    [J]. 电网技术, 2013, 37 (04) : 927 - 935
  • [20] 基于云计算的电力数据中心基础架构及其关键技术
    王德文
    [J]. 电力系统自动化, 2012, 36 (11) : 67 - 71+107