基于改进K-Means聚类和误差反馈的数据清洗方法

被引:31
作者
韩帅 [1 ]
孙乐平 [1 ]
杨艺云 [1 ]
吴宛潞 [1 ]
郭小璇 [1 ]
戴承承 [2 ]
机构
[1] 广西电网有限责任公司电力科学研究院
[2] 广西电网有限责任公司崇左供电局
关键词
综合能源系统; 异常数据识别; 数据插补;
D O I
暂无
中图分类号
TM73 [电力系统的调度、管理、通信]; TK01 [能源];
学科分类号
080802 ; 080702 ;
摘要
综合能源数据的采集与分析是构建综合能源系统的基础和前提,由于数据采集过程中存在系统故障、线路检修等随机因素的制约,其数据常存在异常和缺失情况。为解决上述问题,提出了基于改进K-Means聚类和误差反馈的数据清洗方法,对异常数据进行识别和插补。将异常数据分为不符合用能业务特性的坏数据和缺失数据两类。针对坏数据问题,提出了基于改进K-Means聚类的异常数据识别方法,其中采用Davies-Bouldin(DB)指标解决聚类数K的选取问题;针对缺失数据问题,提出了基于误差反馈的异常数据组合式插补方法。为验证所提方法的有效性,从某园区5个用户4个月的用电数据中选取40组数据,前20组作为样本集以确定插补权重,后20组作为验证集进行验证与对比,结果表明,所提方法具有更高的稳定性与可靠性。
引用
收藏
页码:9 / 15
页数:7
相关论文
共 19 条
[1]   缺失数据的处理方法及其发展趋势 [J].
邓建新 ;
单路宝 ;
贺德强 ;
唐锐 .
统计与决策, 2019, 35 (23) :28-34
[2]   面向电力变压器状态评价的油中溶解气体监测数据补全方法 [J].
张若愚 ;
齐波 ;
张鹏 ;
李成榕 .
电力自动化设备, 2019, 39 (11) :181-187
[3]   基于滑动时窗K-Means聚类的CVT早期故障诊断 [J].
强文渊 ;
韦家富 ;
刘友波 ;
刘俊勇 .
电力电容器与无功补偿, 2019, 40 (03) :89-95
[4]   基于智能电表和PMU混合量测的低压配电网三相状态估计 [J].
陈潇一 ;
王东 ;
曹志 ;
黄伟 ;
樊平 ;
王庆丰 ;
汪适文 ;
陈娟 ;
周冬 .
电网与清洁能源, 2019, 35 (03) :14-20
[5]   基于果蝇优化算法的配电网状态估计 [J].
白晨 ;
曹雯 ;
郭昆丽 .
电网与清洁能源, 2018, 34 (03) :17-20
[6]   基于改进型K-means算法的笼式异步风电场等值研究 [J].
赵东杰 ;
樊艳芳 .
电力电容器与无功补偿, 2018, 39 (01) :147-151
[7]   基于数据挖掘的暂态电力斜坡均衡聚类算法研究 [J].
彭勇 ;
黄梦兰 ;
姜祖明 ;
魏华勇 ;
刘煜 .
电网与清洁能源, 2017, 33 (12) :18-22
[8]   SCADA系统异常数据分析及治理建议 [J].
牛瑞 ;
张望妮 .
电网与清洁能源, 2017, 33 (09) :68-71
[9]   含有历史不良数据的电力负荷预测研究 [J].
杨慧霞 ;
邓迎君 ;
刘志斌 ;
姚睿 .
电力系统保护与控制, 2017, 45 (15) :62-68
[10]   多智能优化算法的配电网状态估计 [J].
童灵华 ;
周开河 ;
范良忠 .
电网与清洁能源, 2017, 33 (02) :8-13