基于柔性行动器–评判器深度强化学习的电–气综合能源系统优化调度

被引：129

作者：

乔骥 ^{[1
]}

王新迎 ^{[1
]}

张擎 ^{[2
]}

张东霞 ^{[1
]}

蒲天骄 ^{[1
]}

机构：

[1] 中国电力科学研究院有限公司

[2] 华北电力大学电气与电子工程学院

来源：

中国电机工程学报 | 2021年 / 41卷 / 03期

关键词：

电-气综合能源系统; 优化调度; 不确定性源荷; 深度强化学习; 柔性行动器-评判器;

D O I：

暂无

中图分类号：

TM73 [电力系统的调度、管理、通信]; TK018 [];

学科分类号：

120103 [信息系统与信息管理];

摘要：

多能流协同优化调度是实现综合能源系统高效经济运行的核心技术之一。面向电–气综合能源系统运行优化问题,提出一种基于柔性行动器-评判器框架的深度强化学习方法,通过智能体与能源系统的交互,自适应学习控制策略。该方法可实现多能流系统的连续动作控制,且能够灵活处理风电、光伏、多能负荷等源荷不确定性问题,实现多场景下的电-气综合能源优化调度决策。首先,构建面向电-气综合能源系统调度的强化学习基本框架,介绍柔性行动器-评判器强化学习的基本原理;然后,构建与智能体交互的电-气综合能源系统环境模型,设计深度强化学习的动作与状态空间、奖励机制、神经网络结构、学习流程等关键环节;最后,针对2个电-气综合能源系统算例进行强化学习优化调度结果分析。

引用

页码：819 / 833

页数：15

共 22 条

[1]

综合能源系统分析的统一能路理论(五)：电–热–气耦合系统优化调度 [J].