基于云计算的智能电网数据挖掘的研究

被引:0
作者
程艳柳
机构
[1] 华北电力大学
关键词
智能电网; MapReduce; k-means算法; canopy算法; LWLR算法;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
随着智能电网的不断建设和发展,在智能终端积累了大量基础用电数据,这些数据具有海量、高频、分散等特点,如何将其转化为有价值的知识以辅助电网企业进行数据分析和决策制定是目前智能电网领域亟待解决的重要问题。数据挖掘是一种能够将大规模数据转换成知识和结论的工具,这些知识和结论能够更好地帮助企业提高决策质量。因此,可以使用数据挖掘来对电网数据进行数据处理和挖掘。不过,传统的数据挖掘算法是基于单节点进行构建,随着数据量的不断增加,其数据存储和分析处理性能都会直线下降,无法满足大规模数据的处理需求。 云计算技术具有分布式存储和并行计算等能力,它通过把多台廉价的普通PC机整合成云计算集群来实现海量数据的安全存储和高效处理,具有扩展性好,处理速度快等特点。所以考虑将云计算与数据挖掘算法相结合,来解决智能电网海量数据的转换问题。 本文以云计算的hadoop平台为基础,将k-means算法、Canopy算法和LWLR算法部署到MapReduce框架上,实现了这三个算法的并行化。然后将两个聚类算法结合起来做了简单应用,用于电网企业用户用电行为分析。将并行化LWLR算法应用于日负荷预测。这些实例应用得到的知识可以帮助电网制定决策。上述应用结果表明文中所用算法不仅可以实现MapReduce化,而且这些并行化的算法对电网海量数据的处理具有有效性。
引用
收藏
页数:53
共 20 条
[1]
基于云计算的并行聚类算法研究 [D]. 
郗洋 .
南京邮电大学,
2011
[2]
基于云计算环境的web数据挖掘算法研究 [D]. 
李雪锋 .
北京交通大学,
2010
[3]
云计算及若干数据挖掘算法的MapReduce化研究 [D]. 
李军华 .
电子科技大学,
2010
[4]
大规模数据聚类技术研究与实现 [D]. 
钱彦江 .
电子科技大学,
2009
[5]
聚类K-means算法及并行化研究 [D]. 
毛嘉莉 .
重庆大学,
2003
[6]
[7]
基于web数据挖掘的健康餐饮分析推荐系统的设计 [J].
李晓城 ;
张增杰 ;
夏勇明 ;
钱松荣 .
微型电脑应用, 2011, 27 (01) :44-46+5
[8]
基于MapReduce的并行贝叶斯分类算法的设计与实现 [J].
丁光华 ;
周继鹏 ;
周敏 .
微计算机信息, 2010, 26 (09) :190-191+176
[9]
基于网格的数据挖掘算法 [J].
齐玉成 ;
郑丽英 ;
高三营 .
电脑知识与技术, 2010, 6 (04) :871-874
[10]
数据挖掘在流程工业中的应用研究 [J].
夏立玲 .
软件导刊, 2009, 8 (10) :178-179