基于Q学习的Agent智能防守策略研究与应用

被引:6
作者
马勇
李龙澍
李学俊
机构
[1] 安徽大学计算智能与信号处理教育部重点实验室
[2] 安徽大学计算机科学与技术学院
基金
安徽省自然科学基金;
关键词
Q学习; 智能体; 机器人足球比赛; 防守策略;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个通用的实验平台,通过它可以来评价各种理论、算法和框架等,已经成为人工智能的研究热点。针对RoboCup仿真中的守门员防守问题,基于Q学习算法,描述了在特定场景中应用Q学习训练守门员的方法和过程。在RobCup中验证了该算法,实现了守门员防守策略的优化。
引用
收藏
页码:106 / 108+112 +112
页数:4
相关论文
共 2 条
[1]   强化学习在机器人足球比赛中的应用 [J].
孟伟 ;
洪炳熔 ;
韩学东 .
计算机应用研究, 2002, (06) :79-81
[2]  
Reinforcement learning. SUTTON R S,BARTO A G. . 1998