多移动机器人系统运动控制研究

被引:0
作者
秦元庆
机构
[1] 华中科技大学
关键词
多机器人系统; 开放式多智能体结构; 路径规划; 粒子群优化算法; 门限偶极子模型; 编队控制; 强化学习; 追捕-逃避博弈;
D O I
暂无
年度学位
2007
学位类型
博士
导师
摘要
机器人技术的发展使机器人的能力不断提高,机器人应用的领域和范围不断扩大。深海作业、核工业故障处理、太空中操作等都迫切需要机器人进入角色。一方面,机器人作业任务的复杂性,迫切需要多机器人的协调与合作来完成。另一方面,通过多机器人间的协调与合作,可以提高机器人系统的工作效率,并使系统具有更强的适应能力和容错能力。在多机器人系统的研究中,多机器人系统运动的协调控制是一个热点研究主题,是该领域中的一个基础性研究方向。本文对多移动机器人系统的体系结构、路径规划、典型协作任务(编队控制与追捕)等议题开展研究,论文主要内容和取得研究结果如下: 论文在综述多机器人系统国内外研究现状的基础上,讨论了多机器人系统体系结构问题,定义了整个系统内的多机器人的相互关系和功能分配,确定了系统和各机器人之间的信息流通关系及其逻辑上的拓扑结构,给出了控制多机器人并使其可以协调合作的机制和计算结构。根据Pioneer 2-DXe型移动智能机器人的特点,本文提出一种基于开放式多智能体结构(open agent architecture,OAA)的多移动机器人协调控制系统,并且依照这一架构,采用多台Pioneer 2DX型机器人和OAA2.3.1软件平台,搭建了一个多机器人实物实验系统。该控制系统具有开放性、即插即用、分布式计算、多模式输入等优良特性,能满足多机器人系统适应未知复杂环境的需要。 本文提出一种基于粒子群优化算法(particle swarm optimization, PSO)的移动机器人全局路径规划方法:首先使用自由空间法构建机器人工作空间自由运动链接图,用图论方法获得链接图网络最短路径;后用PSO优化算法对已得路径进行二次寻优。针对PSO的局部极小问题,提出一种带变异算子的PSO算法,以提高算法搜索成功率。 多机器人路径规划不但要解决避障问题,还要解决避碰问题。本文根据多智能体系统理论,提出一种基于门限偶极子模型(gated dipole model)的分布式多机器人路径规划算法:每个机器人作为一个智能体,独立使用门限偶极子模型进行路径规划。机器人通过传感器以及与其他智能体的通信来获取环境的信息,采用设置动态优先级的方法实现各机器人之间的避碰。 编队控制是一个典型的多机器人协作问题。本文提出一种基于行为的多机器人任意队形控制算法。针对基于行为法只存在局部队形反馈,不能保证队形稳定性的缺陷,结合OAA结构特点,提出带整体队形反馈的编队控制策略,并用李雅普诺夫稳定性定理证明该控制策略是渐近稳定的。 强化学习是一种新的机器学习方法,在机器人领域中有广泛的应用。本文提出一种基于多智能体独立强化学习算法,实现多机器人围捕多入侵者的协作任务。建立了一个能包含大量机器人的多机器人系统仿真实验平台,分析了各种实验条件对机器人群体行为性能的影响;采用PSO算法寻找不同优化指标下的最佳实验配置。
引用
收藏
页数:141
共 56 条
[1]
一种新颖的多agent强化学习方法 [J].
周浦城 ;
洪炳镕 ;
黄庆成 .
电子学报, 2006, (08) :1488-1491
[2]
基于动态角色的多移动目标围捕问题算法研究 [J].
李淑琴 ;
王欢 ;
李伟 ;
杨静宇 .
系统仿真学报, 2006, (02) :362-365+390
[3]
移动机器人的自适应式行为融合方法 [J].
宋梅萍 ;
顾国昌 ;
张汝波 .
哈尔滨工程大学学报, 2005, (05)
[4]
基于强化学习的多机器人协作 [J].
周浦城 ;
洪炳镕 ;
郭耸 .
计算机工程与应用, 2005, (28) :10-12+90
[5]
基于模糊Q学习的多机器人系统研究 [J].
张汝波 ;
施洋 .
哈尔滨工程大学学报, 2005, (04) :477-481
[6]
基于强化学习的多机器人合作行为获取 [J].
李冬梅 ;
陈卫东 ;
席裕庚 ;
不详 .
上海交通大学学报 , 2005, (08) :1331-1335
[7]
动态环境下多机器人合作追捕研究 [J].
周浦城 ;
洪炳镕 ;
王月海 .
机器人, 2005, (04) :289-295+300
[8]
基于多模式交互的多移动机器人分布式合作系统 [J].
陈卫东 ;
顾冬雷 ;
席裕庚 .
自动化学报, 2004, (05) :671-678
[9]
一种多移动机器人协作围捕策略 [J].
苏治宝 ;
陆际联 ;
童亮 .
北京理工大学学报, 2004, (05) :403-406+415
[10]
强化学习研究综述 [J].
高阳 ;
陈世福 ;
陆鑫 .
自动化学报, 2004, (01) :86-100