基于深度强化学习的有轨电车信号优先控制

被引:15
作者
王云鹏 [1 ]
郭戈 [2 ,3 ]
机构
[1] 大连理工大学控制科学与工程学院
[2] 东北大学流程工业综合自动化国家重点实验室
[3] 东北大学秦皇岛分校控制工程学院
关键词
有轨电车; 信号优先; 马尔科夫决策过程; 深度强化学习;
D O I
10.16383/j.aas.c190164
中图分类号
U482.1 [有轨电车]; TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
现有的有轨电车信号优先控制系统存在诸多问题,如无法适应实时交通变化、优化求解较为复杂等.本文提出了一种基于深度强化学习的有轨电车信号优先控制策略.不依赖于交叉口复杂交通建模,采用实时交通信息作为输入,在有轨电车整个通行过程中连续动态调整交通信号.协同考虑有轨电车与社会车辆的通行需求,在尽量保证有轨电车无需停车的同时,降低社会车辆的通行延误.采用深度Q网络算法进行问题求解,并利用竞争架构、双Q网络和加权样本池改善学习性能.基于SUMO的实验表明,该模型能够有效地协同提高有轨电车与社会车辆的通行效率.
引用
收藏
页码:2366 / 2377
页数:12
相关论文
共 12 条
  • [1] Feature-Based Aggregation and Deep Reinforcement Learning:A Survey and Some New Implementations[J]. Dimitri P.Bertsekas.IEEE/CAA Journal of Automatica Sinica. 2019(01)
  • [2] 深度Q学习的二次主动采样方法[J]. 赵英男,刘鹏,赵巍,唐降龙.自动化学报. 2019(10)
  • [3] Traffic Signal Timing via Deep Reinforcement Learning[J]. Li Li,Yisheng Lv,Fei-Yue Wang.IEEE/CAA Journal of Automatica Sinica. 2016(03)
  • [4] 深度学习在控制领域的研究现状与展望
    段艳杰
    吕宜生
    张杰
    赵学亮
    王飞跃
    [J]. 自动化学报, 2016, 42 (05) : 643 - 654
  • [5] 基于强化学习算法的公交信号优先策略
    舒波
    李大铭
    赵新良
    [J]. 东北大学学报(自然科学版), 2012, (10) : 1513 - 1516
  • [6] 强化学习研究综述
    高阳
    陈世福
    陆鑫
    [J]. 自动化学报, 2004, (01) : 86 - 100
  • [7] Coordinated optimization of tram trajectories with arterial signal timing resynchronization[J] . Yuxiong Ji,Yu Tang,Yuchuan Du,Xi Zhang.Transportation Research Part C . 2019
  • [8] Joint optimization of tram timetables and signal timing adjustments at intersections[J] . Jungang Shi,Yanshuo Sun,Paul Schonfeld,Jian Qi.Transportation Research Part C . 2017
  • [9] Design of LRT Signal Priority to Improve Arterial Traffic Mobility[J] . Md Tazul Islam,Jatinder Tiwana,Arun Bhowmick,Tony Z. Qiu.Journal of Transportation Engineering . 2016
  • [10] Design of Reinforcement Learning Parameters for Seamless Application of Adaptive Traffic Signal Control
    El-Tantawy, Samah
    Abdulhai, Baher
    Abdelgawad, Hossam
    [J]. JOURNAL OF INTELLIGENT TRANSPORTATION SYSTEMS, 2014, 18 (03) : 227 - 245