基于模糊聚类的Q-学习在动态调度中的应用

被引:1
作者
王国磊
林琳
钟诗胜
机构
[1] 哈尔滨工业大学机电工程学院
关键词
动态调度; 多智能体; Q-学习; 模糊聚类;
D O I
10.13196/j.cims.2009.04.129.wanggl.023
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对动态多机调度问题,构建了一种多智能体动态调度系统。该系统基于改进合同网机制,由作业对设备的可用时间段进行竞标。为了保证设备智能体能够根据当前系统所处的瞬时状态选择合适的中标作业,提出了一种自适应标书选择策略。该策略考虑动态调度环境下系统状态空间过大的特点,通过提取系统状态特征,采用模糊聚类的方式,降低系统状态空间维数,然后令设备智能体根据聚类状态进行Q-学习。仿真结果表明,基于模糊聚类Q-学习的标书选择策略优于单一标书选择规则,能够提高调度系统对动态调度环境的适应能力。
引用
收藏
页码:751 / 757
页数:7
相关论文
共 7 条
[1]   知识化制造系统中动态调度的自适应策略研究 [J].
杨宏兵 ;
严洪森 .
控制与决策 , 2007, (12) :1335-1340+1346
[2]   基于Q-学习的动态单机调度 [J].
王世进 ;
孙晟 ;
周炳海 ;
奚立峰 .
上海交通大学学报, 2007, (08) :1227-1232+1243
[3]   动态调度的研究方法综述 [J].
钱晓龙 ;
唐立新 ;
刘文新 .
控制与决策, 2001, (02) :141-145
[4]   基于并行进化规划的Job Shop动态调度策略 [J].
翁妙凤 .
小型微型计算机系统, 2000, (06) :620-622
[5]   基于遗传算法的滚动调度策略 [J].
方剑 ;
席裕庚 .
控制理论与应用, 1997, (04) :589-594
[6]   Evaluation of ordering strategies for constraint satisfaction reactive scheduling [J].
Suh, MS ;
Lee, A ;
Lee, YJ ;
Ko, YK .
DECISION SUPPORT SYSTEMS, 1998, 22 (02) :187-197
[7]  
Q -learning[J] . Christopher J. C. H. Watkins,Peter Dayan.Machine Learning . 1992 (3)