基于学习分类器的多机器人路径规划关键技术研究

被引:0
作者
邵杰
机构
[1] 南京理工大学
关键词
多机器人系统; 体系结构; 学习分类器; 人工势场法; 行为控制; 路径规划; 强化学习;
D O I
暂无
年度学位
2011
学位类型
博士
导师
摘要
随着机器人技术在多个领域的广泛应用,在研究和应用双重需求的推动下,多机器人系统的研究已逐渐成为热门领域。在一些面向任务的应用中,合理的体系结构和高效的导航技术是多机器人系统迅速发展的要求,也是多机器人导航的核心关键技术。本文主要研究了以学习分类器为核心算法的多机器人在狭隘环境的路径规划和以路径规划为目标的多机器人系统体系结构、强化学习、行为控制等关键技术。目的在于探索多机器人在狭隘特殊环境下进行路径规划的有效方法,构建适合多机器人系统路径规划的体系结构、强化学习方法、行为控制等关键技术,从而提高多机器人系统路径规划水平,最终高效实现多机器人系统在未知复杂、特殊、狭隘环境下的路径规划。 本文所做的主要研究工作如下: (1)合理的机器人体系结构是完成多机器人路径规划至关重要的基础,本文在对传统机器人体系结构分析的基础上,融合了学习分类器系统算法与势场栅格法技术,提出了基于学习分类器的多机器人路径规划控制体系结构;实现了多机器人体系结构基本功能模块的灵活组合,使得功能和知识都具有良好的扩展性。 (2)机器人路径规划离不开环境信息,如何通过强化学习获得及时准确的环境信息是尤为重要的。因此将梯度下降法映射到学习分类器,融合支持向量机算法与学习分类器系统,提出了基于梯度策略的学习分类器在多机器人强化学习中的应用方法。 (3)行为控制是机器人自主导航过程中最主要的功能之一,本文在融合学习分类器系统与人工势场算法的基础上,尝试研究了机器人在未知狭隘环境中的四种覆盖策略,提出了基于多学习分类器和人工势场法的多机器人行为控制策略。 (4)提出了基于学习分类器的多机器人在狭隘环境中的避碰规划,在理论上推导并证明了信用分配算法的收敛性,为本文提出的路径规划算法的收敛提供了理论保证。 (5)提出了基于精度的学习分类器在有易燃、易爆、易碎等障碍物的危险狭隘环境中的多机器人避碰规划,精确地解决了多机器人在特殊狭隘环境下的路径规划和避碰问题。 (6)本文在最后一章对全文进行了总结,并且对今后进一步的研究方向进行了展望。
引用
收藏
页数:112
共 65 条
[1]
基于进化算法的智能机器人行为学习研究 [D]. 
王作为 .
哈尔滨工程大学,
2006
[2]
基于强化学习和群集智能方法的多机器人协作协调研究 [D]. 
王醒策 .
哈尔滨工程大学,
2005
[3]
未知环境中移动机器人导航控制理论与方法.[M].蔡自兴; 贺汉根; 陈虹; 编著.科学出版社.2009,
[4]
实用数学手册.[M].叶其孝;沈永欢主编;.科学出版社.2006,
[5]
多机器人系统.[M].谭民;王硕;曹志强[编著];.清华大学出版社.2005,
[6]
未知环境下势场法路径规划的局部极小问题研究.[J].朱毅;张涛;宋靖雁;.自动化学报.2010, 08
[7]
未知环境下改进的基于RRT算法的移动机器人路径规划 [J].
康亮 ;
赵春霞 ;
郭剑辉 .
模式识别与人工智能, 2009, 22 (03) :337-343
[8]
CGF中基于遗传算法的路径跟踪自学习研究 [J].
孟宪权 ;
薛青 ;
赵英男 ;
唐志武 .
系统仿真学报, 2009, 21 (10) :2925-2929
[9]
基于协同最小二乘支持向量机的Q学习.[J].王雪松;田西兰;程玉虎;易建强;.自动化学报.2009, 02
[10]
基于情感与环境认知的移动机器人自主导航控制 [J].
张惠娣 ;
刘士荣 .
控制理论与应用, 2008, 25 (06) :995-1000