结合Q学习和模糊逻辑的单路口交通信号自学习控制方法

被引:12
作者
何兆成
佘锡伟
杨文臣
陈宁宁
机构
[1] 中山大学智能交通研究中心广东省智能交通系统重点实验室
基金
广东省科技计划;
关键词
交通信号控制; 强化学习; BP神经网络; 模糊评价; Paramics仿真;
D O I
暂无
中图分类号
U491.54 [];
学科分类号
0838 ;
摘要
针对城市交通系统的动态性和不确定性,提出了基于强化学习的信号交叉口智能控制系统结构,对单交叉口动态实时控制进行了研究。将BP神经网络与Q学习算法相结合实现了路口的在线学习。同时,针对交通信号控制的多目标评价特征,采用基于模糊逻辑的Q学习奖惩信号设计方法,实施对交通信号的优化控制。最后,在三种交通场景下,应用Paramics微观交通仿真软件对典型十字路口进行仿真实验。结果表明,该方法对不同交通场景下的突变仍可保持较高的控制效率,控制效果明显优于定时控制。
引用
收藏
页码:199 / 202
页数:4
相关论文
共 7 条
[1]   基于神经网络的Agent增强学习模型 [J].
唐亮贵 ;
刘波 ;
唐灿 ;
程代杰 .
计算机科学, 2007, (11) :156-158+297
[2]   基于Agent控制器的单路口信号灯学习控制方法研究 [J].
高丽颖 ;
陈阳舟 ;
李振龙 .
交通与计算机, 2007, (05) :59-62
[3]   基于Q-learning和BP神经元网络的交叉口信号灯控制 [J].
赵晓华 ;
石建军 ;
李振龙 ;
赵国勇 .
公路交通科技, 2007, (07) :99-102
[4]   单路口交通信号多相位实时控制模型及其算法 [J].
徐勋倩 ;
黄卫 .
控制理论与应用, 2005, (03) :413-416+422
[5]   一种基于Agent的单路口交通信号学习控制方法 [J].
马寿峰 ;
李英 ;
刘豹 .
系统工程学报, 2002, (06) :526-530
[6]  
城市交通控制.[M].全永编著;.人民交通出版社.1989,
[7]   Reinforcement learning for True Adaptive traffic signal control [J].
Abdulhai, B ;
Pringle, R ;
Karakoulas, GJ .
JOURNAL OF TRANSPORTATION ENGINEERING, 2003, 129 (03) :278-285