Q学习在RoboCup前场进攻动作决策中的应用

被引:6
作者
章惠龙
李龙澍
机构
[1] 安徽大学计算机科学与技术学院
基金
安徽省自然科学基金;
关键词
Q学习; RoboCup; 多智能体协作;
D O I
暂无
中图分类号
TP242 [机器人]; TP18 [人工智能理论];
学科分类号
1111 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
RoboCup是世界上规模最大的机器人足球大赛,包括软件仿真与硬件实体两类项目的比赛。RoboCup仿真2D作为软件仿真项目的重要组成部分,成为研究人工智能和多Agent智能体协作的优秀实验平台。将Q学习应用到RoboCup仿真2D比赛的前场进攻动作决策中,通过引入区域划分,基于区域划分的奖惩函数和对真人足球赛中动作决策的模拟,在经过大量周期的学习训练后,使Agent能够进行自主动作决策,从而加强了多Agent的前场进攻实力。
引用
收藏
页码:240 / 242
页数:3
相关论文
共 2 条
[1]   基于Q学习的Agent智能防守策略研究与应用 [J].
马勇 ;
李龙澍 ;
李学俊 .
计算机技术与发展, 2008, 18 (12) :106-108+112
[2]   基于改进的Q学习的RoboCup传球策略研究 [J].
周勇 ;
刘锋 .
计算机技术与发展, 2008, (04) :63-66