学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Q学习算法的发电公司决策新模型附视频
被引:8
作者
:
宋依群
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电气工程系
宋依群
论文数:
引用数:
h-index:
机构:
吴炯
机构
:
[1]
上海交通大学电气工程系
来源
:
上海交通大学学报
|
2006年
/ 04期
关键词
:
电力市场;
Q学习算法;
Markov决策过程;
策略行为;
D O I
:
10.16183/j.cnki.jsjtu.2006.04.004
中图分类号
:
TM743 [模拟与仿真];
学科分类号
:
080802 ;
摘要
:
提出了基于Q学习的发电公司决策新模型,应用于求解发电公司在具有不完全信息的电力市场环境下为获取最优长期利润而制定的决策问题.以电力市场重复运行具有的典型Markov过程特性,应用Q学习算法构建以长期利润最优为目标的发电公司决策模型,并通过算例仿真验证了该模型的有效性.所提出的决策新模型可以根据发电公司对市场状态变化的不同预估状态转移概率模拟该公司在市场环境下的不同竞价策略,并给出不确定市场环境下的最优决策.
引用
收藏
页码:568 / 571
页数:4
相关论文
共 1 条
[1]
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
←
1
→
共 1 条
[1]
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
←
1
→