结合降维技术的电力负荷曲线集成聚类算法

被引:145
作者
张斌 [1 ]
庄池杰 [1 ]
胡军 [1 ]
陈水明 [1 ]
张明明 [2 ]
王科 [2 ]
曾嵘 [1 ]
机构
[1] 电力系统及发电设备控制和仿真国家重点实验室(清华大学电机系)
[2] 南方电网科学研究院
关键词
能源互联网; 电力大数据; 负荷曲线; 聚类有效性; 集成聚类算法;
D O I
10.13334/j.0258-8013.pcsee.2015.15.001
中图分类号
TM714 [负荷分析];
学科分类号
080802 ;
摘要
电力负荷曲线聚类是配用电大数据挖掘的基础。分析3种典型聚类有效性指标,指出Davies-Bouldin有效性指标更适用于评估负荷曲线的聚类结果。研究基于层次、基于划分、基于密度、基于模型等类型的聚类算法,从聚类效率和聚类质量两方面评价各种算法。层次聚类的质量较高,效率较低;划分聚类的效率较高,质量较低。针对单一聚类算法的不足,研究基于经典聚类算法的集成聚类算法并将其应用于负荷曲线聚类。该算法包括bootstrap重采样、划分聚类、层次聚类3步,对不同规模数据集的聚类结果表明集成算法具有更好的性能,特别适用于大规模数据集聚类。针对电力负荷曲线的特征,研究多种数据集降维算法,在降维后的数据集上进行集成聚类,比较各种降维算法的信息损失和计算效率。研究结果表明,对于大规模电力负荷曲线的聚类问题,结合主成分分析降维的集成聚类算法可以取得最佳效果。
引用
收藏
页码:3741 / 3749
页数:9
相关论文
共 13 条
[1]   智能电网条件下的需求响应关键技术 [J].
田世明 ;
王蓓蓓 ;
张晶 .
中国电机工程学报, 2014, 34 (22) :3576-3589
[2]   智能电网大数据处理技术现状与挑战 [J].
宋亚奇 ;
周国亮 ;
朱永利 .
电网技术, 2013, 37 (04) :927-935
[3]   运用聚类算法预测地区电网典型日负荷曲线 [J].
李翔 ;
顾洁 .
电力与能源, 2013, 34 (01) :47-50
[4]   改进FCM算法及其在电力负荷坏数据处理的应用 [J].
蒋雯倩 ;
李欣然 ;
钱军 .
电力系统及其自动化学报, 2011, 23 (05) :1-5
[5]   基于用户日负荷曲线的用电行业分类与综合方法 [J].
李欣然 ;
姜学皎 ;
钱军 ;
陈辉华 ;
宋军英 ;
黄良刚 .
电力系统自动化, 2010, 34 (10) :56-61
[6]   模糊聚类在负荷实测建模中的应用 [J].
黄梅 ;
贺仁睦 ;
杨少兵 .
电网技术, 2006, (14) :49-52
[7]   基于模糊聚类的电力负荷特性的分类与综合 [J].
李培强 ;
李欣然 ;
陈辉华 ;
唐外文 .
中国电机工程学报, 2005, (24) :73-78
[8]   New indices for cluster validity assessment [J].
Kim, M ;
Ramakrishna, RS .
PATTERN RECOGNITION LETTERS, 2005, 26 (15) :2353-2363
[9]  
Validity index for crisp and fuzzy clusters[J] . Malay K. Pakhira,Sanghamitra Bandyopadhyay,Ujjwal Maulik.Pattern Recognition . 2003 (3)
[10]   Non-linear dimensionality reduction techniques for unsupervised feature extraction [J].
De Backer, S ;
Naud, A ;
Scheunders, P .
PATTERN RECOGNITION LETTERS, 1998, 19 (08) :711-720