不完全信息下基于深度双Q网络的发电商三段式竞价策略

被引:16
作者
杨朋朋 [1 ]
王蓓蓓 [1 ]
胥鹏 [1 ]
王高琴 [2 ]
郑亚先 [2 ]
机构
[1] 东南大学电气工程学院
[2] 中国电力科学研究院有限公司
关键词
深度强化学习; 发电商竞价策略; 三段式竞价; DDQN;
D O I
暂无
中图分类号
F426.61 []; TM73 [电力系统的调度、管理、通信];
学科分类号
120103 [信息系统与信息管理];
摘要
不完全信息的电力市场环境下发电商仅知道自身相关的信息,而其他市场参与者的报价和市场环境都可能会影响市场出清结果,进而影响发电商的收益,因此其报价决策应当考虑多维的市场信息。基于深度强化学习算法,提出多智能体的DDQN(double deep Q-network)算法模拟日前现货市场中发电商三段式竞价策略的过程。首先,定义发电商模型中马尔可夫决策过程的要素和动作价值函数;然后,建立发电商深度双Q网络的框架,并引入经验池和动态ε-greedy算法进行神经网络的训练,该决策模型可以根据市场的出清电价和负荷水平等多维连续状态做出报价;最后,通过算例比较了发电商采用DDQN和传统Qlearning两种算法获得的收益差别,说明DDQN算法可以根据发电商面临的复杂市场环境做出正确的决策而Q-learning算法在环境复杂时决策能力较差,并在不同状态量选取、网络泛化能力、更大规模算例适应性等方面分析了发电商采用DDQN算法进行市场策略生成的有效性和优越性。
引用
收藏
页码:47 / 58
页数:12
相关论文
共 25 条
[1]
基于组合赋权和梯形云模型的发电商市场力评价 [J].
刘军 ;
王苗 ;
严清心 ;
王彩 ;
袁超 .
电力科学与技术学报, 2021, 36 (02) :58-66
[2]
基于多代理Double DQN算法模拟发电侧竞价行为 [J].
高宇 ;
李昀 ;
曹蓉蓉 ;
李宁峰 ;
高铭泽 .
电网技术, 2020, 44 (11) :4175-4183
[3]
基于强化学习的电力市场信息披露程度对市场成员交易行为影响研究 [J].
高怡静 ;
肖艳炜 ;
杨朋朋 ;
朱炳铨 ;
林凯颖 ;
王蓓蓓 .
智慧电力, 2020, 48 (02) :109-118
[4]
基于深度Q网络的电力工控网络异常检测系统 [J].
王竹晓 ;
张彭彭 ;
李为 ;
吴克河 ;
崔文超 ;
程瑞 .
计算机与现代化, 2019, (12) :114-118
[5]
电动汽车充电控制的深度增强学习优化方法 [J].
杜明秋 ;
李妍 ;
王标 ;
张艺涵 ;
罗潘 ;
王少荣 .
中国电机工程学报, 2019, 39 (14) :4042-4049
[6]
基于优势学习的深度Q网络 [J].
夏宗涛 ;
秦进 .
计算机工程与应用, 2019, (20) :101-106
[7]
基于双层粒子群算法求解电力市场均衡 [J].
谢畅 ;
王蓓蓓 ;
赵盛楠 ;
谈健 ;
黄俊辉 ;
谢珍建 .
电网技术, 2018, 42 (04) :1170-1177
[8]
基于深度强化学习的电网紧急控制策略研究 [J].
刘威 ;
张东霞 ;
王新迎 ;
侯金秀 ;
刘丽平 .
中国电机工程学报, 2018, 38 (01) :109-119+347
[9]
美国电力市场信息披露体系及其对中国的启示 [J].
马子明 ;
钟海旺 ;
李竹 ;
汪洋 ;
夏清 .
电力系统自动化, 2017, 41 (24) :49-57
[10]
发电商基于Q-Learning算法的日前市场竞价策略 [J].
王帅 .
能源技术经济, 2010, 22 (03) :34-39