基于Q-学习的动态单机调度

被引:10
作者
王世进
孙晟
周炳海
奚立峰
机构
[1] 上海交通大学机械与动力工程学院
关键词
Q-学习; 强化学习; 动态单机调度; 调度规则选择;
D O I
10.16183/j.cnki.jsjtu.2007.08.004
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对当前基于Q-学习的Agent生产调度优化研究甚少的现状,利用Q-学习对动态单机调度问题在3种不同系统目标下的调度规则动态选择问题进行了研究.在建立Q-学习与动态单机调度问题映射机制的基础上,通过MATLAB实验仿真,对算法性能进行了评价.仿真结果表明,对于不同的系统调度目标,Q-学习能提高Agent的适应能力,达到单一调度规则无法达到的性能,适合基于Agent的动态生产调度环境.
引用
收藏
页码:1227 / 1232+1243 +1243
页数:7
相关论文
共 5 条
[1]   基于强化学习的多机器人合作行为获取 [J].
李冬梅 ;
陈卫东 ;
席裕庚 .
上海交通大学学报, 2005, (08) :1331-1335
[2]   一种基于分布式强化学习的多智能体协调方法 [J].
范波 ;
潘泉 ;
张洪才 .
计算机仿真, 2005, (06) :115-117+151
[3]   资源受限单机动态调度的并行GA算法研究 [J].
魏英姿 ;
赵明扬 .
系统仿真学报, 2005, (04) :827-830
[4]  
Dynamic job-shop scheduling using reinforcement learning agents[J] . Robotics and Autonomous Systems . 2000 (2)
[5]  
Q -learning[J] . Christopher J. C. H. Watkins,Peter Dayan.Machine Learning . 1992 (3)