基于分布式多步回溯Q(λ)学习的复杂电网最优潮流算法

被引:12
作者
余涛 [1 ]
刘靖 [1 ]
胡细兵 [2 ]
机构
[1] 华南理工大学电力学院
[2] 安庆供电公司
关键词
最优潮流; Q(λ)学习; 多目标优化; 分布式强化学习;
D O I
10.19595/j.cnki.1000-6753.tces.2012.04.030
中图分类号
TM744 [电力系统的计算];
学科分类号
摘要
针对传统最优潮流算法对复杂多目标函数的不适应性以及常规算法难以满足大规模电网计算实时性的要求,本文中提出一种新颖的基于复杂电网分区的最优潮流分布式Q(λ)学习算法,该算法无须对最优潮流数学模型进行辅助处理,不依赖于对象模型,其内部各Agent使用标准的多步Q(λ)算法独立承担各分区子系统的学习任务,通过统一协作从而形成整体意义上的最优,并在IEEE 118节点等标准算例中进行了验证,取得了良好的效果,为解决复杂电网多目标最优潮流问题提供了一种新的可行、有效的方法。
引用
收藏
页码:185 / 192
页数:8
相关论文
共 16 条
  • [11] 大电网最优潮流计算[M]. 科学出版社 , 刘明波, 2010
  • [12] 强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
  • [13] 可扩展并行算法的设计与分析[M]. 国防工业出版社 , 李晓梅等著, 2000
  • [14] 遗传算法原理及应用[M]. 国防工业出版社 , 周明, 1999
  • [15] Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
  • [16] Optimal power flow by Newton approach .2 Sun DI,Ashley B,Brewer B,et al. IEEE Transactions on Power Apparatus and Systems . 1984