基于深度强化学习的激励型需求响应决策优化模型

被引：57

作者：

徐弘升 ^{[1
]}

陆继翔 ^{[1
,2
]}

杨志宏 ^{[1
,2
]}

李昀 ^{[1
]}

陆进军 ^{[1
,2
]}

黄华 ^{[1
,2
]}

机构：

[1] 南瑞集团有限公司(国网电力科学研究院有限公司)

[2] 智能电网保护与运行控制国家重点实验室

来源：

电力系统自动化 | 2021年 / 45卷 / 14期

基金：

国家重点研发计划;

关键词：

激励型需求响应; 价格弹性系数; 深度强化学习; 深度Q学习网络;

D O I：

暂无

中图分类号：

F426.61 []; F274 [企业供销管理];

学科分类号：

120301 [农业经济管理];

摘要：

随着中国电力市场化改革的推进,售电侧市场逐步开放,售电商可以聚合大量的分散负荷参与电力市场环境下的需求响应。文中提出以售电商和用户综合收益最大化为目标的基于深度强化学习的激励型需求响应建模和求解方法。首先,建立售电商和用户的需求响应模型,通过引入时间-价格弹性,改进现有的用户响应模型,考虑用户对相邻时段补贴价格差的反应。然后,基于马尔可夫决策过程框架构建补贴价格决策优化模型,并设计基于深度Q学习网络的求解算法。最后,以1个售电商和3个不同类型的用户为例进行仿真计算,通过分析算法收敛性和对比不同模型及参数下的优化结果,验证了改进模型的合理性和生成策略的有效性,并分析了激励型需求响应对售电商以及用户的影响。

引用

页码：97 / 103

页数：7

共 27 条

[1]

电力现货市场下计及售电商长期收益的需求侧响应 [J].