基于性能预测的遗传强化学习动态调度方法

被引:17
作者
魏英姿 [1 ]
谷侃锋 [2 ]
机构
[1] 沈阳理工大学信息科学与工程学院
[2] 中国科学院沈阳自动化研究所沈阳现代装备研究设计中心
关键词
强化学习; 遗传算法; 预测; 生产周期; 作业车间动态调度;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
针对作业车间动态调度问题,在模式驱动调度的框架下,提出遗传强化学习动态调度方法。首先,采用优先规则编码的染色体表达问题的解,将染色体分割成基因模式作为分阶段调度算法的状态模式;其次,设计性能预测变量,构建启发式立即回报函数,引导和加快遗传强化学习算法的搜索进程;再次,设置遗传算子、强化学习及其相关参数以实现搜索过程"开采"与"探索"之间的平衡;最后,仿真实验结果验证了遗传强化学习调度方法的有效性。
引用
收藏
页码:2809 / 2812+2820 +2820
页数:5
相关论文
共 6 条
[1]
同顺序Flow-shop问题的一种遗传强化学习算法 [J].
潘燕春 ;
周泓 ;
冯允成 ;
魏佳呈 .
系统工程理论与实践, 2007, (09) :115-122
[2]
基于合同网协议交互投标的动态调度方法研究 [J].
魏英姿 ;
曲艳丽 ;
胡玉兰 .
计算机科学, 2007, (07) :124-127
[3]
RLGA:一种基于强化学习机制的遗传算法 [J].
王本年 ;
高阳 ;
陈兆乾 ;
谢俊元 ;
陈世福 .
电子学报, 2006, (05) :856-860+866
[4]
规则调度的迭代优化 [J].
孙容磊 ;
熊有伦 ;
杜润生 ;
丁汉 .
计算机集成制造系统-CIMS, 2002, (07) :546-550
[5]
Dynamic job-shop scheduling using reinforcement learning agents.[J]..Robotics and Autonomous Systems.2000, 2
[6]
A DYNAMIC JOB-SHOP SCHEDULING FRAMEWORK - A BACKWARD APPROACH [J].
SUN, D ;
LIN, L .
INTERNATIONAL JOURNAL OF PRODUCTION RESEARCH, 1994, 32 (04) :967-985