电力大数据的价值密度评价及结合改进k-means的提升方法研究

被引:26
作者
王赛一 [1 ]
余建平 [1 ]
孙丰杰 [2 ]
王承民 [2 ]
谢宁 [2 ]
机构
[1] 国网上海市电力公司浦东供电公司
[2] 上海交通大学电子信息与电气工程学院
关键词
电力大数据; 价值密度; 评价指标; k-means算法; 三层过滤机制;
D O I
暂无
中图分类号
TM715 [电力系统规划]; TP311.13 [];
学科分类号
080802 [电力系统及其自动化];
摘要
针对目前电力大数据价值密度的研究存在缺乏定义和量化指标、提升手段单一导致效果有限的问题,提出了相关定义及评价指标,从空间上内存占用、时间上运行速率2个维度计算价值密度评价指标;并提出了基于多初始聚类中心的改进k-means算法,弥补其太过依赖于初始聚类中心的不足。结合该算法,分别从"脏数据"、记录、字段等不同维度,研究如何提升价值密度。以日负荷预测为算例进行仿真测试,结果表明评价指标能较好地反映价值密度,改进聚类算法有较好的的聚类效果和速率优势,可以有效提升数据价值密度。
引用
收藏
页码:8 / 15
页数:8
相关论文
共 13 条
[1]
Bounded Partial-Order Reduction [J].
Coons, Katherine E. ;
Musuvathi, Madanlal ;
McKinley, Kathryn S. .
ACM SIGPLAN NOTICES, 2013, 48 (10) :833-848
[2]
基于CUDA技术的海量电力负荷曲线聚类算法 [J].
吴霜 ;
季聪 ;
孙国强 .
电力工程技术, 2018, 37 (04) :65-70
[3]
基于主成分分析法与对应分析法的县域配电网状况评估 [J].
谢晓帆 ;
刘秋林 ;
李斌 ;
刘沛 ;
陶丹 ;
胡钋 .
智慧电力, 2018, 46 (06) :68-73
[4]
面向智能电网大数据关联规则挖掘的频繁模式网络模型 [J].
孙丰杰 ;
王承民 ;
谢宁 .
电力自动化设备, 2018, 38 (05) :110-116
[6]
基于DT法和粗糙集理论的接地网安全性状态评定 [J].
王思华 ;
杨桐 ;
段启凡 ;
赵峰 .
电力系统保护与控制, 2017, 45 (02) :48-54
[7]
结合降维技术的电力负荷曲线集成聚类算法 [J].
张斌 ;
庄池杰 ;
胡军 ;
陈水明 ;
张明明 ;
王科 ;
曾嵘 .
中国电机工程学报, 2015, 35 (15) :3741-3749
[8]
基于改进K-means聚类算法的供电块划分方法 [J].
韩俊 ;
谈健 ;
黄河 ;
乔黎伟 .
电力自动化设备, 2015, 35 (06) :123-129
[9]
基于云计算技术的电力大数据预处理属性约简方法 [J].
曲朝阳 ;
陈帅 ;
杨帆 ;
朱莉 .
电力系统自动化, 2014, 38 (08) :67-71
[10]
大数据时代下数据质量的挑战 [J].
宗威 ;
吴锋 .
西安交通大学学报(社会科学版), 2013, 33 (05) :38-43