多智能体强化学习在城市交通网络信号控制方法中的应用综述

被引:29
作者
杨文臣 [1 ,2 ]
张轮 [2 ]
Zhu Feng [3 ]
机构
[1] 云南省交通规划设计研究院陆地交通气象灾害防治技术国家工程实验室
[2] 同济大学道路与交通工程教育部重点实验室
[3] 南洋理工大学土木与环境工程学院
关键词
智能交通; 交通控制; 多智能体强化学习; 闭环反馈; 联动协调; 数据驱动;
D O I
暂无
中图分类号
TP273 [自动控制、自动控制系统]; U491.51 [];
学科分类号
080201 ; 0835 ;
摘要
交通信号控制系统在物理位置和控制逻辑上分散于动态变化的网络交通环境,将每个路口的交通信号控制器看做一个异质的智能体,非常适合采用无模型、自学习、数据驱动的多智能体强化学习(MARL)方法建模与描述。为了研究该方法的现状、存在问题及发展前景,系统跟踪了多智能体强化学习在国内外交通控制领域的具体应用,包括交通信号MARL控制概念模型、完全孤立的多智能体强化学习(MARL)的控制、部分状态合作的多智能体强化学习控制和动作联动的多智能体强化学习(MARL)控制,分析其技术特征和代际差异,讨论了多智体强化学习方法在交通信号控制中的研究动向,提出了发展网络交通信号多智能体强化学习集成控制的关键问题在于强化学习控制机理、联动协调性、交通状态特征抽取和多模式整合控制。
引用
收藏
页码:1613 / 1618
页数:6
相关论文
共 20 条