基于多步回溯Q学习的自动发电控制指令动态优化分配算法

被引:15
作者
余涛 [1 ]
王宇名 [2 ]
甄卫国 [1 ]
叶文加 [1 ]
刘前进 [1 ]
机构
[1] 华南理工大学电力学院
[2] 广东电网公司中山供电局
基金
广东省自然科学基金;
关键词
Q(λ)学习; 自动发电控制; 控制性能标准; 随机最优; 调节费用;
D O I
暂无
中图分类号
TM76 [电力系统的自动化];
学科分类号
080802 ;
摘要
单步Q学习在火电占优、机组时延较大的自动发电控制(AGC)功率指令动态优化分配中的应用表现出收敛速度慢等不足而影响最优策略的获取.具有多步预见能力的多步回溯Q学习(Q(λ))显式利用资格迹进行高效回溯操作,能够有效解决火电机组大时滞环节带来的延时回报问题,算法平均收敛时间较Q学习缩短50%以上.算法奖励函数引入调节费用一项,形成多目标动态最优控制.两区域模型及南方电网模型仿真研究分析显示,Q(λ)算法在随机、大负荷扰动的复杂系统环境中有效提高系统控制性能标准(CPS)控制品质和适应性,并且在保证CPS合格率的前提下,使AGC调节费用下降超过5%.
引用
收藏
页码:58 / 64
页数:7
相关论文
共 11 条
[1]   互联电网CPS调节指令动态最优分配Q–学习算法 [J].
余涛 ;
王宇名 ;
刘前进 .
中国电机工程学报, 2010, 30 (07) :62-69
[2]   基于Q学习的互联电网动态最优CPS控制 [J].
余涛 ;
周斌 ;
陈家荣 .
中国电机工程学报, 2009, 29 (19) :13-19
[3]   基于现代内点理论的互联电网控制性能评价标准下的AGC控制策略 [J].
李滨 ;
韦化 ;
农蔚涛 ;
李林峰 ;
吴阿琴 ;
阳育德 .
中国电机工程学报, 2008, (25) :56-61
[4]   基于CPS统计信息自学习机理的AGC自适应控制 [J].
余涛 ;
陈亮 ;
蔡广林 .
中国电机工程学报, 2008, (10) :82-87
[5]   互联电网CPS标准下的自动发电控制策略 [J].
高宗和 ;
滕贤亮 ;
张小白 .
电力系统自动化, 2005, (19) :40-44
[6]   基于CPS的AGC控制策略研究 [J].
唐跃中 ;
张王俊 ;
张健 ;
陈明 .
电网技术, 2004, (21) :75-79
[7]   互联电网AGC分层控制与CPS控制策略 [J].
高宗和 ;
滕贤亮 ;
涂力群 .
电力系统自动化, 2004, (01) :78-81
[8]   强化学习理论、算法及应用 [J].
张汝波 ;
顾国昌 ;
刘照德 ;
王醒策 .
控制理论与应用, 2000, (05) :637-642
[9]   A new approach to the design of robust load-frequency controller for large scale power systems [J].
Ray, G ;
Prasad, AN ;
Prasad, GD .
ELECTRIC POWER SYSTEMS RESEARCH, 1999, 51 (01) :13-22
[10]  
Incremental multi-step Q-learning.[J].Jing Peng;Ronald J. Williams.Machine Learning.1996, 1