学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于主智能体的群体学习算法GLBMA
被引:4
作者
:
程显毅
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
程显毅
李淑琴
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
李淑琴
夏德深
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
夏德深
机构
:
[1]
南京理工大学计算机系
[2]
南京理工大学计算机系 江苏南京
来源
:
江苏大学学报(自然科学版)
|
2005年
/ 05期
关键词
:
智能体;
主智能体;
强化学习;
RoboCup;
行为学习状态空间;
D O I
:
暂无
中图分类号
:
TP18 [人工智能理论];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
摘要
:
以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,传统群体强化学习算法中的行为学习状态空间过大,连续状态空间的行为选择及多智能体合作求解等问题得到了解决.
引用
收藏
页码:437 / 439
页数:3
相关论文
共 3 条
[1]
机器人足球策略的研究
潘凌寒
论文数:
0
引用数:
0
h-index:
0
机构:
江苏大学计算机科学与通信工程学院
潘凌寒
论文数:
引用数:
h-index:
机构:
程显毅
殷秀莲
论文数:
0
引用数:
0
h-index:
0
机构:
江苏大学计算机科学与通信工程学院
殷秀莲
[J].
江苏大学学报(自然科学版),
2004,
(03)
: 257
-
260
[2]
国际机器人足球比赛及其相关技术
李实
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
李实
徐旭明
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
徐旭明
叶榛
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
叶榛
孙增圻
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
孙增圻
[J].
机器人,
2000,
(05)
: 420
-
426
[3]
The road to RoboCup 2050 .2 Hans-D ieter Burkhard,Donm inique Duhaut,FujitaMasahiro,et al. IEEE Robotics& Automation Magazine . 2002
←
1
→
共 3 条
[1]
机器人足球策略的研究
潘凌寒
论文数:
0
引用数:
0
h-index:
0
机构:
江苏大学计算机科学与通信工程学院
潘凌寒
论文数:
引用数:
h-index:
机构:
程显毅
殷秀莲
论文数:
0
引用数:
0
h-index:
0
机构:
江苏大学计算机科学与通信工程学院
殷秀莲
[J].
江苏大学学报(自然科学版),
2004,
(03)
: 257
-
260
[2]
国际机器人足球比赛及其相关技术
李实
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
李实
徐旭明
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
徐旭明
叶榛
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
叶榛
孙增圻
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系国家智能技术与系统重点实验室!北京
孙增圻
[J].
机器人,
2000,
(05)
: 420
-
426
[3]
The road to RoboCup 2050 .2 Hans-D ieter Burkhard,Donm inique Duhaut,FujitaMasahiro,et al. IEEE Robotics& Automation Magazine . 2002
←
1
→