自适应模糊RBF神经网络的多智能体机器人强化学习

被引:3
作者
张文志
李智军
吕恬生
罗青
不详
机构
[1] 上海交通大学机器人研究所
[2] 上海交通大学机器人研究所 上海
[3] 上海
[4] 上海
关键词
模糊RBF神经网络; Q学习; 多机器人;
D O I
暂无
中图分类号
TP242 [机器人];
学科分类号
1111 ;
摘要
多机器人环境中的学习,由于机器人所处的环境是连续状态,连续动作,而且包含多个机器人,因此学习空间巨大,直接应用Q学习算法难以获得满意的结果。文章研究中针对多智能体机器人系统的学习问题,提出自适应模糊RBF神经网络强化学习算法,网络本身具有模糊推理能力、较强的函数逼近能力以及泛化能力,因此,实现了人类专家知识与机器学习方法的结合,减少学习问题的复杂度;实现连续状态空间与动作空间的策略学习。
引用
收藏
页码:111 / 115
页数:5
相关论文
共 2 条
[1]  
ReinforcementLearning:ASurvey犤J犦. LPKaelbling,MLLittleman,AWMoore. JournalofArtificialIntelligenceRes . 1996
[2]  
Reinforcementlearning:Anintroduction犤M犦. SuttonRS,BartoAG. . 1998