学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Q学习的Agent智能防守策略研究与应用
被引:6
作者
:
论文数:
引用数:
h-index:
机构:
马勇
论文数:
引用数:
h-index:
机构:
李龙澍
李学俊
论文数:
0
引用数:
0
h-index:
0
机构:
安徽大学计算智能与信号处理教育部重点实验室
李学俊
机构
:
[1]
安徽大学计算智能与信号处理教育部重点实验室
[2]
安徽大学计算机科学与技术学院
来源
:
计算机技术与发展
|
2008年
/ 18卷
/ 12期
基金
:
安徽省自然科学基金;
关键词
:
Q学习;
智能体;
机器人足球比赛;
防守策略;
D O I
:
暂无
中图分类号
:
TP18 [人工智能理论];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
摘要
:
模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个通用的实验平台,通过它可以来评价各种理论、算法和框架等,已经成为人工智能的研究热点。针对RoboCup仿真中的守门员防守问题,基于Q学习算法,描述了在特定场景中应用Q学习训练守门员的方法和过程。在RobCup中验证了该算法,实现了守门员防守策略的优化。
引用
收藏
页码:106 / 108+112 +112
页数:4
相关论文
共 2 条
[1]
强化学习在机器人足球比赛中的应用
[J].
孟伟
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
孟伟
;
洪炳熔
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
洪炳熔
;
韩学东
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
韩学东
.
计算机应用研究,
2002,
(06)
:79
-81
[2]
Reinforcement learning. SUTTON R S,BARTO A G. . 1998
←
1
→
共 2 条
[1]
强化学习在机器人足球比赛中的应用
[J].
孟伟
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
孟伟
;
洪炳熔
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
洪炳熔
;
韩学东
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
韩学东
.
计算机应用研究,
2002,
(06)
:79
-81
[2]
Reinforcement learning. SUTTON R S,BARTO A G. . 1998
←
1
→