基于Q学习算法的发电公司决策新模型附视频

被引:8
作者
宋依群
吴炯
机构
[1] 上海交通大学电气工程系
关键词
电力市场; Q学习算法; Markov决策过程; 策略行为;
D O I
10.16183/j.cnki.jsjtu.2006.04.004
中图分类号
TM743 [模拟与仿真];
学科分类号
080802 ;
摘要
提出了基于Q学习的发电公司决策新模型,应用于求解发电公司在具有不完全信息的电力市场环境下为获取最优长期利润而制定的决策问题.以电力市场重复运行具有的典型Markov过程特性,应用Q学习算法构建以长期利润最优为目标的发电公司决策模型,并通过算例仿真验证了该模型的有效性.所提出的决策新模型可以根据发电公司对市场状态变化的不同预估状态转移概率模拟该公司在市场环境下的不同竞价策略,并给出不确定市场环境下的最优决策.
引用
收藏
页码:568 / 571
页数:4
相关论文
共 1 条
[1]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)