基于平均报酬模型全过程R(λ)学习的互联电网CPS最优控制

被引:10
作者
余涛
袁野
机构
[1] 华南理工大学电力学院
基金
中央高校基本科研业务费专项资金资助; 广东省自然科学基金;
关键词
控制性能标准(CPS); 自动发电控制(AGC); 平均报酬模型; R(λ)学习; 模仿学习;
D O I
暂无
中图分类号
TM76 [电力系统的自动化];
学科分类号
080802 ;
摘要
提出了一种新颖的基于平均报酬模型的全过程R(λ)学习互联电力系统CPS最优控制方法。该方法与电网自动发电控制(AGC)追求较高的考核时间段内的10min平均控制性能标准(CPS)指标合格率的目标相吻合,且所提出的基于平均报酬模型的R(λ)学习算法与基于折扣报酬模型的Q(λ)学习算法相比,在线学习收敛速度更快,可获得更佳的CPS指标。此外,所提出的改进的R(λ)控制器具有全过程在线学习的特点,其预学习过程被一种新型的在线"模仿学习"所代替,克服了以往强化学习控制需要另外搭建仿真模型来进行预学习收敛的严重缺陷,提高了R(λ)控制器的学习效率及其在实际电力系统中的应用性。
引用
收藏
页码:27 / 33
页数:7
相关论文
共 10 条
[1]   基于Q学习的互联电网动态最优CPS控制 [J].
余涛 ;
周斌 ;
陈家荣 .
中国电机工程学报, 2009, 29 (19) :13-19
[2]   基于强化学习的互联电网CPS自校正控制 [J].
余涛 ;
周斌 .
电力系统保护与控制, 2009, 37 (10) :33-38
[3]   基于CPS统计信息自学习机理的AGC自适应控制 [J].
余涛 ;
陈亮 ;
蔡广林 .
中国电机工程学报, 2008, (10) :82-87
[4]   基于平均报酬模型的强化学习算法研究 [J].
黄炳强 ;
曹广益 ;
费燕琼 ;
王占全 .
上海理工大学学报, 2006, (05) :418-422
[5]   互联电网CPS标准下的自动发电控制策略 [J].
高宗和 ;
滕贤亮 ;
张小白 .
电力系统自动化, 2005, (19) :40-44
[6]   基于CPS的AGC控制策略研究 [J].
唐跃中 ;
张王俊 ;
张健 ;
陈明 .
电网技术, 2004, (21) :75-79
[7]   平均报酬模型的多步强化学习算法 [J].
胡光华 ;
吴沧浦 .
控制理论与应用, 2000, (05) :660-664
[8]  
强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
[9]  
马尔可夫决策过程引论[M]. 西安电子科技大学出版社 , 胡奇英, 2000
[10]   A new approach to the design of robust load-frequency controller for large scale power systems [J].
Ray, G ;
Prasad, AN ;
Prasad, GD .
ELECTRIC POWER SYSTEMS RESEARCH, 1999, 51 (01) :13-22