基于递阶强化学习的多智能体AGV调度系统

被引：46

作者：

李晓萌

杨煜普

许晓鸣

机构：

[1] 上海交通大学自动化研究所,上海交通大学自动化研究所,上海交通大学自动化研究所上海,上海,上海

来源：

关键词：

递阶强化学习; MaxQ方法; 多智能体协作; AGV调度;

D O I：

暂无

中图分类号：

TP181 [自动推理、机器学习];

学科分类号：

140502 [人工智能];

摘要：

递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法 ,而具有 Max Q递阶强化学习能力的多智能体通过高效的强化学习方法和协作 ,可以实现 AGV的实时调度。仿真实验证明了这种方法的有效性

引用

页码：292 / 296

页数：5