互联电网CPS调节指令动态最优分配Q–学习算法

被引:56
作者
余涛
王宇名
刘前进
机构
[1] 华南理工大学电力学院
基金
广东省自然科学基金;
关键词
Q–学习; 随机最优; 离散时间马尔可夫决策过程; 控制性能标准; 自动发电控制;
D O I
暂无
中图分类号
TM744 [电力系统的计算];
学科分类号
080802 [电力系统及其自动化];
摘要
控制性能标准(control performance standard,CPS)下互联电网调度端的自动发电控制(automatic generation control,AGC)指令(简称CPS指令)到各类型AGC机组的动态优化分配是随机最优问题。将CPS指令分配的连续控制过程离散化,并可将其看作是一个离散时间马尔可夫决策过程,提出应用基于Q–学习的动态控制方法。根据优化目标的差异,设计不同的奖励函数,并将其引入到算法当中,有效结合水、火电机组的调节特性,并考虑水电机组的调节裕度,提高AGC系统调节能力。遗传算法和工程实用方法在标准两区域模型及南方电网模型的仿真研究显示,Q–学习有效提高了系统的适应性、鲁棒性和CPS考核合格率。
引用
收藏
页码:62 / 69
页数:8
相关论文
共 14 条
[1]
强化学习理论及应用.[M].张汝波编著;.哈尔滨工程大学出版社.2001,
[2]
A reinforcement learning approach to automatic generation control [J].
Ahamed, TPI ;
Rao, PSN ;
Sastry, PS .
ELECTRIC POWER SYSTEMS RESEARCH, 2002, 63 (01) :9-26
[3]
A new approach to the design of robust load-frequency controller for large scale power systems [J].
Ray, G ;
Prasad, AN ;
Prasad, GD .
ELECTRIC POWER SYSTEMS RESEARCH, 1999, 51 (01) :13-22
[4]
Technical Note: Q-Learning.[J].Christopher J.C.H. Watkins;Peter Dayan.Machine Learning.1992, 3
[5]
基于Q学习的互联电网动态最优CPS控制 [J].
余涛 ;
周斌 ;
陈家荣 .
中国电机工程学报, 2009, 29 (19) :13-19
[6]
基于现代内点理论的互联电网控制性能评价标准下的AGC控制策略 [J].
李滨 ;
韦化 ;
农蔚涛 ;
李林峰 ;
吴阿琴 ;
阳育德 .
中国电机工程学报, 2008, (25) :56-61
[7]
基于CPS统计信息自学习机理的AGC自适应控制 [J].
余涛 ;
陈亮 ;
蔡广林 .
中国电机工程学报, 2008, (10) :82-87
[8]
互联电网CPS标准下的自动发电控制策略 [J].
高宗和 ;
滕贤亮 ;
张小白 .
电力系统自动化, 2005, (19) :40-44
[9]
基于CPS的AGC控制策略研究 [J].
唐跃中 ;
张王俊 ;
张健 ;
陈明 .
电网技术, 2004, (21) :75-79
[10]
强化学习研究综述 [J].
高阳 ;
陈世福 ;
陆鑫 .
自动化学报, 2004, (01) :86-100