多智能体强化学习在足球机器人中的研究与应用

被引:19
作者
刘春阳 [1 ,2 ]
谭应清 [1 ]
柳长安 [1 ]
马莹巍 [1 ]
机构
[1] 华北电力大学控制与计算机工程学院
[2] 北京科技大学信息工程学院
关键词
强化学习; 机器人足球; 多智能体系统; 投票;
D O I
暂无
中图分类号
TP242.6 [智能机器人];
学科分类号
081104 ;
摘要
本文提出一种基于投票的多智能体强化学习方法,使球队在比赛中学会协作,自动适应环境,提高实时性和进球数.首先通过定义称为策略的联合行为,将协作问题转化为对策略的学习,简化问题的处理;然后对球场进行划分,以区域表示位置,有效减少了状态空间维数,加快了学习速度;接下来通过区分环境状态并只考虑协作状态,减小状态空间,进一步提高了学习速度;并使用投票的方式综合各个队员的决策,达到协作的目的.最后通过实验结果表明了该方法的正确性和有效性.
引用
收藏
页码:1958 / 1962
页数:5
相关论文
共 8 条
[1]   用基于知识的遗传算法实现移动机器人路径规划 [J].
周兰凤 ;
洪炳熔 .
电子学报, 2006, (05) :911-914
[2]   一种基于强化学习的学习Agent [J].
李宁 ;
高阳 ;
陆鑫 ;
陈世福 .
计算机研究与发展, 2001, (09) :1051-1056
[3]   一种基于Agent团队的强化学习模型与应用研究 [J].
蔡庆生 ;
张波 .
计算机研究与发展, 2000, (09) :1087-1093
[4]   Building agent teams using an explicit teamwork model and learning [J].
Tambe, M ;
Adibi, J ;
Al-Onaizan, Y ;
Erdem, A ;
Kaminka, GA ;
Marsella, SC ;
Muslea, I .
ARTIFICIAL INTELLIGENCE, 1999, 110 (02) :215-239
[5]   MULTIAGENT NEGOTIATION UNDER TIME CONSTRAINTS [J].
KRANS, S ;
WILKENFELD, J ;
ZLOTKIN, G .
ARTIFICIAL INTELLIGENCE, 1995, 75 (02) :297-345
[6]   OBJECT BEHAVIOR ANALYSIS [J].
RUBIN, KS ;
GOLDBERG, A .
COMMUNICATIONS OF THE ACM, 1992, 35 (09) :48-62
[7]  
Q -learning[J] . Christopher J. C. H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
[8]  
Reinforcement Learning:An Introduc-tion .2 R S Sutton,A G Barto. MIT Press . 1999