基于多步回溯Q(λ)学习的互联电网随机最优CPS控制

被引:15
作者
余涛 [1 ]
周斌 [1 ,2 ]
陈家荣 [2 ]
机构
[1] 华南理工大学电力学院
[2] 香港理工大学电机工程学系
基金
广东省自然科学基金;
关键词
自动发电控制; 控制性能标准; 多步Q(λ)学习; 非马尔可夫环境; 随机最优控制;
D O I
10.19595/j.cnki.1000-6753.tces.2011.06.028
中图分类号
TM732 [电力系统的运行];
学科分类号
摘要
针对非马尔可夫环境下火电占优的互联电网AGC控制策略,引入随机最优控制中Q(λ)学习的"后向估计"原理,可有效解决火电机组大时滞环节带来的延时回报问题。本文以CPS1/CPS2滚动平均值为状态输入,将CPS评价指标与松弛目标根据线性加权原则转化为MDP奖励函数,从长期的角度提出一种在线反馈学习结构的随机最优CPS控制。统计性仿真试验表明,所提CPS控制具有较强的适应性和动态性能,在保证CPS合格率基础上能有效减少调度端的平均发令次数和反调次数。同时,该策略提供了一种可通过修正松弛因子在线调整AGC系统的"松弛度",可降低发电成本及机组磨损,从而实现CPS松弛控制。
引用
收藏
页码:179 / 186
页数:8
相关论文
共 9 条
  • [1] 最优控制理论与应用.[M].张洪钺;王青编著;.高等教育出版社.2006,
  • [2] 强化学习理论及应用.[M].张汝波编著;.哈尔滨工程大学出版社.2001,
  • [3] 马尔可夫决策过程引论.[M].胡奇英;刘建庸著;.西安电子科技大学出版社.2000,
  • [4] Q-LEARNING
    WATKINS, CJCH
    DAYAN, P
    [J]. MACHINE LEARNING, 1992, 8 (3-4) : 279 - 292
  • [5] 基于Q学习的互联电网动态最优CPS控制
    余涛
    周斌
    陈家荣
    [J]. 中国电机工程学报, 2009, 29 (19) : 13 - 19
  • [6] 基于现代内点理论的互联电网控制性能评价标准下的AGC控制策略
    李滨
    韦化
    农蔚涛
    李林峰
    吴阿琴
    阳育德
    [J]. 中国电机工程学报, 2008, (25) : 56 - 61
  • [7] 基于CPS统计信息自学习机理的AGC自适应控制
    余涛
    陈亮
    蔡广林
    [J]. 中国电机工程学报, 2008, (10) : 82 - 87
  • [8] 考虑控制性能标准的AGC机组经济补偿研究
    贾德香
    程浩忠
    熊虎岗
    范宏
    陈明
    马鸿杰
    [J]. 中国电机工程学报, 2007, (31) : 52 - 56
  • [9] 互联电网AGC分层控制与CPS控制策略
    高宗和
    滕贤亮
    涂力群
    [J]. 电力系统自动化, 2004, (01) : 78 - 81