基于多代理Double DQN算法模拟发电侧竞价行为

被引:32
作者
高宇 [1 ,2 ]
李昀 [1 ,2 ]
曹蓉蓉 [1 ,2 ]
李宁峰 [1 ,2 ]
高铭泽 [1 ,2 ]
机构
[1] 国电南瑞科技股份有限公司
[2] 南瑞集团有限公司(国网电力科学研究院有限公司)
关键词
多代理; Double DQN; 神经网络; 竞价行为; 纳什均衡;
D O I
暂无
中图分类号
F426.61 []; TM73 [电力系统的调度、管理、通信];
学科分类号
120103 [信息系统与信息管理];
摘要
强化学习已经成为研究发电侧竞价策略的重要方法,而Q-Learning算法的Q-table维度问题是限制其应用在发电侧竞价策略的主要原因,为此文章采用智能多代理Double DQN(doubledeepq-learningnetwork,DDQN)算法进行研究。DDQN算法采用神经网络估计值函数与选择动作策略,解决了Q-Learning会因为状态序列的增加导致计算量庞大甚至无法求解的问题。此外,文章根据日前市场发电商报价方式设计了报价策略并作为DDQN的动作空间,将发电商中标电量与负荷需求作为DDQN的状态序列,在tensorflow环境中模拟竞价过程。实验结果表明,使用DDQN算法模拟发电商竞价行为是可行的,并且参与竞价的发电商都达到了纳什均衡点。
引用
收藏
页码:4175 / 4183
页数:9
相关论文
共 14 条
[1]
电力系统的迁移强化学习优化算法研究 [D]. 
张孝顺 .
华南理工大学,
2017
[2]
人工智能技术在电网调控中的应用研究 [J].
范士雄 ;
李立新 ;
王松岩 ;
刘幸蔚 ;
於益军 ;
郝博文 .
电网技术, 2020, 44 (02) :401-411
[3]
基于优先记忆库结合竞争深度Q网络的动态功率控制 [J].
叶梓峰 ;
王永华 ;
万频 ;
杨贺淞 ;
黄沛濠 .
电讯技术, 2019, 59 (10) :1132-1139
[4]
基于Double-DQN的平衡类游戏改善附视频 [J].
孙鹏 ;
孙若莹 ;
刘滨翔 .
电子设计工程, 2019, (14) :112-116
[5]
多主体参与可再生能源消纳的Nash博弈模型及其迁移强化学习求解 [J].
李宏仲 ;
王磊 ;
林冬 ;
张雪莹 .
中国电机工程学报, 2019, 39 (14) :4135-4150
[6]
电动汽车充电控制的深度增强学习优化方法 [J].
杜明秋 ;
李妍 ;
王标 ;
张艺涵 ;
罗潘 ;
王少荣 .
中国电机工程学报, 2019, 39 (14) :4042-4049
[7]
发电商的模仿学习竞价策略 [J].
曾亮 ;
齐翔 ;
陈迎春 .
中国电机工程学报, 2008, (31) :74-80
[8]
独立发电商的策略报价研究 [J].
高鑫 ;
王秀丽 ;
雷兵 ;
王锡凡 .
中国电机工程学报, 2004, (07)
[9]
电力市场中不同竞价撮合机制的优化模型研究 [D]. 
郝翠甜 .
华北电力大学(北京),
2019
[10]
深度增强学习的改进研究 [D]. 
肖嘉鸣 .
东南大学,
2018