多智能体强化学习飞行路径规划算法

被引：7

作者：

李东华

江驹

姜长生

机构：

[1] 南京航空航天大学自动化学院

来源：

电光与控制 | 2009年 / 16卷 / 10期

关键词：

多智能体系统; 强化学习; 路径规划; 无人机; 自主规划;

D O I：

暂无

中图分类号：

N945 [系统工程]; E926.3 [各种军用飞机];

学科分类号：

071102 ; 0826 ; 082601 ;

摘要：

为了减轻现代空战中大量信息处理给飞行员带来的负担,同时为了实现无人机航路自主规划,提出了一种基于多智能体强化学习理论的飞行路径规划算法。该算法采用多智能体强化学习的方法,采用两个功能不同的智能体,分别对应局部和全局路径规划。该算法对状态和动作空间进行划分和抽象,有效地减少了状态的数量,解决了强化学习维数灾难的问题。最后用Matlab对此算法进行了数字仿真,验证了算法的可行性,仿真实验结果显示该算法收敛速度快,能够解决飞行路径规划的任务。

引用

页码：10 / 14

页数：5

共 7 条

[1] 基于A*算法的坦克CGF全局路径规划 [J].

燕明 ;

李文清 ;

周涛 .

指挥控制与仿真, 2008, (03) :28-30+35

[2] 基于遗传算法的自主机器人避障方法研究 [J].

孔伟 ;

张彦铎 .

武汉工程大学学报, 2008, (03) :110-113

[3] 一种机器人路径规划的蚁群算法 [J].

陈雄 ;

袁杨 .

系统工程与电子技术, 2008, (05) :952-955

[4] 采用粒子群优化算法的无人机实时航迹规划 [J].

孙彪 ;

朱凡 .

电光与控制, 2008, (01) :35-38

[5] 强化学习研究综述 [J].

高阳 ;

陈世福 ;

陆鑫 .

自动化学报, 2004, (01) :86-100

[6]

Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning.[J].Richard S. Sutton;Doina Precup;Satinder Singh.Artificial Intelligence.1999, 1

[7]

分层强化学习理论与方法.[M].沈晶; 编著.哈尔滨工程大学出版社.2007,

← 1 →