多智能体强化学习飞行路径规划算法

被引:7
作者
李东华
江驹
姜长生
机构
[1] 南京航空航天大学自动化学院
关键词
多智能体系统; 强化学习; 路径规划; 无人机; 自主规划;
D O I
暂无
中图分类号
N945 [系统工程]; E926.3 [各种军用飞机];
学科分类号
071102 ; 0826 ; 082601 ;
摘要
为了减轻现代空战中大量信息处理给飞行员带来的负担,同时为了实现无人机航路自主规划,提出了一种基于多智能体强化学习理论的飞行路径规划算法。该算法采用多智能体强化学习的方法,采用两个功能不同的智能体,分别对应局部和全局路径规划。该算法对状态和动作空间进行划分和抽象,有效地减少了状态的数量,解决了强化学习维数灾难的问题。最后用Matlab对此算法进行了数字仿真,验证了算法的可行性,仿真实验结果显示该算法收敛速度快,能够解决飞行路径规划的任务。
引用
收藏
页码:10 / 14
页数:5
相关论文
共 7 条
[1]   基于A*算法的坦克CGF全局路径规划 [J].
燕明 ;
李文清 ;
周涛 .
指挥控制与仿真, 2008, (03) :28-30+35
[2]   基于遗传算法的自主机器人避障方法研究 [J].
孔伟 ;
张彦铎 .
武汉工程大学学报, 2008, (03) :110-113
[3]   一种机器人路径规划的蚁群算法 [J].
陈雄 ;
袁杨 .
系统工程与电子技术, 2008, (05) :952-955
[4]   采用粒子群优化算法的无人机实时航迹规划 [J].
孙彪 ;
朱凡 .
电光与控制, 2008, (01) :35-38
[5]   强化学习研究综述 [J].
高阳 ;
陈世福 ;
陆鑫 .
自动化学报, 2004, (01) :86-100
[6]  
Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning.[J].Richard S. Sutton;Doina Precup;Satinder Singh.Artificial Intelligence.1999, 1
[7]  
分层强化学习理论与方法.[M].沈晶; 编著.哈尔滨工程大学出版社.2007,