基于柔性行动器–评判器深度强化学习的电–气综合能源系统优化调度

被引:129
作者
乔骥 [1 ]
王新迎 [1 ]
张擎 [2 ]
张东霞 [1 ]
蒲天骄 [1 ]
机构
[1] 中国电力科学研究院有限公司
[2] 华北电力大学电气与电子工程学院
关键词
电-气综合能源系统; 优化调度; 不确定性源荷; 深度强化学习; 柔性行动器-评判器;
D O I
暂无
中图分类号
TM73 [电力系统的调度、管理、通信]; TK018 [];
学科分类号
120103 [信息系统与信息管理];
摘要
多能流协同优化调度是实现综合能源系统高效经济运行的核心技术之一。面向电–气综合能源系统运行优化问题,提出一种基于柔性行动器-评判器框架的深度强化学习方法,通过智能体与能源系统的交互,自适应学习控制策略。该方法可实现多能流系统的连续动作控制,且能够灵活处理风电、光伏、多能负荷等源荷不确定性问题,实现多场景下的电-气综合能源优化调度决策。首先,构建面向电-气综合能源系统调度的强化学习基本框架,介绍柔性行动器-评判器强化学习的基本原理;然后,构建与智能体交互的电-气综合能源系统环境模型,设计深度强化学习的动作与状态空间、奖励机制、神经网络结构、学习流程等关键环节;最后,针对2个电-气综合能源系统算例进行强化学习优化调度结果分析。
引用
收藏
页码:819 / 833
页数:15
相关论文
共 22 条
[1]
综合能源系统分析的统一能路理论(五):电–热–气耦合系统优化调度 [J].
陈瑜玮 ;
孙宏斌 ;
郭庆来 .
中国电机工程学报, 2020, 40 (24) :7928-7937+8230
[2]
基于深度强化学习的自适应不确定性经济调度 [J].
彭刘阳 ;
孙元章 ;
徐箭 ;
廖思阳 ;
杨丽 .
电力系统自动化, 2020, 44 (09) :33-42
[3]
高压配电网与天然气管网互联的转供优化模型 [J].
周念成 ;
何宽 ;
王强钢 ;
雷超 ;
蒋一平 .
中国电机工程学报, 2020, 40 (05) :1432-1443
[4]
基于改进K-means聚类技术与半不变量法的电–气综合能源系统运行风险评估方法 [J].
谢桦 ;
陈昊 ;
邓晓洋 ;
张沛 ;
孙芊 .
中国电机工程学报, 2020, 40 (01) :59-69+374
[5]
基于演化博弈的区域电–气互联综合能源系统用户需求侧响应行为分析 [J].
窦迅 ;
王俊 ;
王湘艳 ;
吴磊 .
中国电机工程学报, 2020, 40 (12) :3775-3786
[6]
电-气互联系统建模与运行优化研究方法评述 [J].
陈泽兴 ;
林楷东 ;
张勇军 ;
陈伯达 ;
苏洁莹 .
电力系统自动化, 2020, 44 (03) :11-23
[7]
多主体参与可再生能源消纳的Nash博弈模型及其迁移强化学习求解 [J].
李宏仲 ;
王磊 ;
林冬 ;
张雪莹 .
中国电机工程学报, 2019, 39 (14) :4135-4150
[8]
基于深度强化学习的微电网复合储能协调控制方法 [J].
张自东 ;
邱才明 ;
张东霞 ;
徐舒玮 ;
贺兴 .
电网技术, 2019, 43 (06) :1914-1921
[9]
基于多主体博弈与强化学习的并网型综合能源微网协调调度 [J].
刘洪 ;
李吉峰 ;
葛少云 ;
张鹏 ;
陈星屹 .
电力系统自动化, 2019, 43 (01) :40-48
[10]
考虑风电不确定性的电气能源系统两阶段分布鲁棒协同调度 [J].
税月 ;
刘俊勇 ;
高红均 ;
邱高 ;
胥威汀 ;
苟竞 .
电力系统自动化, 2018, 42 (13) :43-50+75