学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
共享经验分布式Q-学习模型在RoboCup中的应用
被引:1
作者
:
论文数:
引用数:
h-index:
机构:
张煌辉
[
1
]
论文数:
引用数:
h-index:
机构:
陈焕文
[
1
,
2
]
刘泽文
论文数:
0
引用数:
0
h-index:
0
机构:
湖南信息职业技术学院
长沙理工大学计算机与通信工程学院
刘泽文
[
2
]
论文数:
引用数:
h-index:
机构:
陈哲平
[
1
]
机构
:
[1]
长沙理工大学计算机与通信工程学院
[2]
湖南信息职业技术学院
来源
:
微计算机信息
|
2010年
/ 26卷
/ 08期
关键词
:
共享经验;
分布式Q-学习;
多智能体;
RoboCup;
D O I
:
暂无
中图分类号
:
TP181 [自动推理、机器学习];
TP242 [机器人];
学科分类号
:
1111 ;
摘要
:
RoboCup仿真比赛平台提供了一个完全分布式控制、实时异步多智能体的环境,从而为多智能体的智能控制和人工智能理论的研究提供了绝佳的实验平台。文中提出了一种基于共享经验策略的分布式Q-学习模型,应用于RoboCup仿真实验中,取得了较好的效果。
引用
收藏
页码:25 / 26
页数:2
相关论文
共 4 条
[1]
强化学习方法及其应用研究.[D].黄炳强.上海交通大学.2007, 06
[2]
基于遗传算法的智能机器人对抗策略设计
论文数:
引用数:
h-index:
机构:
戴光耀
康立山
论文数:
0
引用数:
0
h-index:
0
机构:
中国地质大学计算机学院
康立山
[J].
微计算机信息,
2008,
24
(35)
: 254
-
255+262
[3]
基于主智能体的群体学习算法GLBMA
程显毅
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
程显毅
李淑琴
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
李淑琴
夏德深
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
夏德深
[J].
江苏大学学报(自然科学版),
2005,
(05)
: 437
-
439
[4]
强化学习理论、算法及应用
论文数:
引用数:
h-index:
机构:
张汝波
顾国昌
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机系!哈尔滨
顾国昌
刘照德
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机系!哈尔滨
刘照德
王醒策
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机系!哈尔滨
王醒策
[J].
控制理论与应用,
2000,
(05)
: 637
-
642
←
1
→
共 4 条
[1]
强化学习方法及其应用研究.[D].黄炳强.上海交通大学.2007, 06
[2]
基于遗传算法的智能机器人对抗策略设计
论文数:
引用数:
h-index:
机构:
戴光耀
康立山
论文数:
0
引用数:
0
h-index:
0
机构:
中国地质大学计算机学院
康立山
[J].
微计算机信息,
2008,
24
(35)
: 254
-
255+262
[3]
基于主智能体的群体学习算法GLBMA
程显毅
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
程显毅
李淑琴
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
李淑琴
夏德深
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机系
夏德深
[J].
江苏大学学报(自然科学版),
2005,
(05)
: 437
-
439
[4]
强化学习理论、算法及应用
论文数:
引用数:
h-index:
机构:
张汝波
顾国昌
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机系!哈尔滨
顾国昌
刘照德
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机系!哈尔滨
刘照德
王醒策
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机系!哈尔滨
王醒策
[J].
控制理论与应用,
2000,
(05)
: 637
-
642
←
1
→