基于主智能体的群体学习算法GLBMA

被引:4
作者
程显毅
李淑琴
夏德深
机构
[1] 南京理工大学计算机系
[2] 南京理工大学计算机系 江苏南京
关键词
智能体; 主智能体; 强化学习; RoboCup; 行为学习状态空间;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,传统群体强化学习算法中的行为学习状态空间过大,连续状态空间的行为选择及多智能体合作求解等问题得到了解决.
引用
收藏
页码:437 / 439
页数:3
相关论文
共 3 条
  • [1] 机器人足球策略的研究
    潘凌寒
    程显毅
    殷秀莲
    [J]. 江苏大学学报(自然科学版), 2004, (03) : 257 - 260
  • [2] 国际机器人足球比赛及其相关技术
    李实
    徐旭明
    叶榛
    孙增圻
    [J]. 机器人, 2000, (05) : 420 - 426
  • [3] The road to RoboCup 2050 .2 Hans-D ieter Burkhard,Donm inique Duhaut,FujitaMasahiro,et al. IEEE Robotics& Automation Magazine . 2002