基于强化学习的互联电网CPS自校正控制

被引:19
作者
余涛
周斌
机构
[1] 华南理工大学电力学院
基金
广东省自然科学基金;
关键词
强化学习; Q学习算法; 自动发电控制; CPS标准; 自校正控制;
D O I
暂无
中图分类号
TM76 [电力系统的自动化];
学科分类号
080802 ;
摘要
AGC是一个动态多级决策问题——马尔可夫决策过程(MDP),应用强化学习算法可有效地实现控制策略的在线学习和动态优化决策。引入Q学习算法作为强化学习核心算法,将CPS值看作包含AGC的电力系统"环境"所给的"奖励",依靠奖励值Q函数与CPS控制动作形成的闭环控制结构实现在线学习。学习目标是使CPS控制动作从环境获得的长期积累奖励值最大,从而快速自动地在线优化CPS控制系统的输出。仿真研究显示,引入强化学习自校正控制后显著增强了整个AGC系统的鲁棒性和适应性,有效提高了CPS考核合格率。
引用
收藏
页码:33 / 38
页数:6
相关论文
共 9 条
[1]   基于CPS统计信息自学习机理的AGC自适应控制 [J].
余涛 ;
陈亮 ;
蔡广林 .
中国电机工程学报, 2008, (10) :82-87
[2]   互联电网CPS标准下的自动发电控制策略 [J].
高宗和 ;
滕贤亮 ;
张小白 .
电力系统自动化, 2005, (19) :40-44
[3]   基于CPS的AGC控制策略研究 [J].
唐跃中 ;
张王俊 ;
张健 ;
陈明 .
电网技术, 2004, (21) :75-79
[4]   互联电网AGC分层控制与CPS控制策略 [J].
高宗和 ;
滕贤亮 ;
涂力群 .
电力系统自动化, 2004, (01) :78-81
[5]   CPS/DCS标准在大区互联电网AGC控制策略中的应用 [J].
李正 ;
敬东 ;
赵强 ;
颜泉 .
电力系统及其自动化学报, 2003, (02) :27-32+48
[6]  
强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
[7]   A new approach to the design of robust load-frequency controller for large scale power systems [J].
Ray, G ;
Prasad, AN ;
Prasad, GD .
ELECTRIC POWER SYSTEMS RESEARCH, 1999, 51 (01) :13-22
[8]   ASYNCHRONOUS STOCHASTIC-APPROXIMATION AND Q-LEARNING [J].
TSITSIKLIS, JN .
MACHINE LEARNING, 1994, 16 (03) :185-202
[9]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)