在策略SARSA算法在互联电网CPS最优控制中的应用

被引:14
作者
余涛
张水平
机构
[1] 华南理工大学电力学院
关键词
随机控制; 自动发电控制; CPS标准; SARSA算法; 强化学习;
D O I
暂无
中图分类号
TM76 [电力系统的自动化];
学科分类号
080802 ;
摘要
CPS标准下的互联电网的自动发电控制(AGC)系统是一个典型的不确定随机系统,提出一种新型应用于AGC系统的随机最优控制策略——基于SARSA算法的互联电网CPS最优控制策略。SARSA算法更多地考虑控制策略动作的花费,倾向于避开进入随机系统中搜索一些危险的状态,相对于离策略(off-policy)的Q学习算法,在策略(on-policy)SARSA算法的学习试错过程中对受控系统影响更小。仿真结果表明,基于SARSA算法的CPS控制器较Q学习算法有更好的鲁棒性和适应性,能够获得更佳的CPS指标。
引用
收藏
页码:211 / 216
页数:6
相关论文
共 13 条
[1]   强化学习的模型、算法及应用 [J].
战忠丽 ;
王强 ;
陈显亭 .
电子科技, 2011, 24 (01) :47-49
[2]   遗传蚁群融合算法及在不确定性无功优化中的应用研究 [J].
周申培 ;
严新平 .
电力系统保护与控制, 2010, 38 (24) :120-123
[3]   基于平均报酬模型全过程R(λ)学习的互联电网CPS最优控制 [J].
余涛 ;
袁野 .
电力系统自动化, 2010, 34 (21) :27-33
[4]   对CPS标准下AGC与一次调频配合问题的研究 [J].
王珍意 ;
谢一工 ;
尹成全 ;
刘和森 .
电力系统保护与控制, 2009, 37 (19) :22-25+51
[5]   基于证据理论的可中断负荷不确定性风险收益评估模型 [J].
张颖 ;
张有兵 ;
曹一家 ;
常向伟 .
电力系统保护与控制, 2009, 37 (16) :1-6
[6]   强化学习理论在电力系统中的应用及展望 [J].
余涛 ;
周斌 ;
甄卫国 .
电力系统保护与控制, 2009, 37 (14) :122-128
[7]   基于Q学习的互联电网动态最优CPS控制 [J].
余涛 ;
周斌 ;
陈家荣 .
中国电机工程学报, 2009, 29 (19) :13-19
[8]   基于强化学习的互联电网CPS自校正控制 [J].
余涛 ;
周斌 .
电力系统保护与控制, 2009, 37 (10) :33-38
[9]   试验设计中的重复试验次数的确定 [J].
管宇 ;
杨琪瑜 .
生物数学学报, 2005, (03) :115-120
[10]   强化学习研究综述 [J].
高阳 ;
陈世福 ;
陆鑫 .
自动化学报, 2004, (01) :86-100