学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
多智能体协作的两层强化学习实现方法
被引:4
作者
:
陈雪江
论文数:
0
引用数:
0
h-index:
0
机构:
浙江工业大学信息学院
陈雪江
杨东勇
论文数:
0
引用数:
0
h-index:
0
机构:
浙江工业大学信息学院
杨东勇
范荣真
论文数:
0
引用数:
0
h-index:
0
机构:
浙江工业大学信息学院
范荣真
机构
:
[1]
浙江工业大学信息学院
来源
:
计算机工程
|
2005年
/ 03期
基金
:
浙江省自然科学基金;
关键词
:
强化学习;
Q学习;
多智能体;
协作;
D O I
:
暂无
中图分类号
:
TP242 [机器人];
学科分类号
:
1111 ;
摘要
:
提出了多智能体协作的两层强化学习方法。该方法主要通过在单个智能体中构筑两层强化学习单元来实现,将该方法应用于3个智能体协作抬起圆形物体的计算机模拟中,结果表明比采用传统强化学习方法的智能体协作得更好。
引用
收藏
页码:192 / 194
页数:3
相关论文
共 6 条
[1]
强化学习在机器人足球比赛中的应用
孟伟
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
孟伟
洪炳熔
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
洪炳熔
韩学东
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
韩学东
[J].
计算机应用研究,
2002,
(06)
: 79
-
81
[2]
基于Markov对策和强化学习的多智能体协作研究
李晓萌
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系!上海
李晓萌
杨煜普
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系!上海
杨煜普
许晓鸣
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系!上海
许晓鸣
[J].
上海交通大学学报,
2001,
(02)
: 288
-
292
[3]
一种基于Agent团队的强化学习模型与应用研究
论文数:
引用数:
h-index:
机构:
蔡庆生
张波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系!合肥
张波
[J].
计算机研究与发展,
2000,
(09)
: 1087
-
1093
[4]
基于Markov对策的多Agent强化学习模型及算法研究
高阳
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
高阳
周志华
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
周志华
何佳洲
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
何佳洲
陈世福
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
陈世福
不详
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
不详
[J].
计算机研究与发展 ,
2000,
(03)
: 257
-
263
[5]
智能协作信息技术[M]. 电子工业出版社 , 姚莉, 2002
[6]
Reinforcement learning in the multi-robot domain
Mataric, MJ
论文数:
0
引用数:
0
h-index:
0
机构:
Volen Center for Complex Systems, Computer Science Department, Brandeis University, Waltham
Mataric, MJ
[J].
AUTONOMOUS ROBOTS,
1997,
4
(01)
: 73
-
83
←
1
→
共 6 条
[1]
强化学习在机器人足球比赛中的应用
孟伟
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
孟伟
洪炳熔
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
洪炳熔
韩学东
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系智能机器人研究室
韩学东
[J].
计算机应用研究,
2002,
(06)
: 79
-
81
[2]
基于Markov对策和强化学习的多智能体协作研究
李晓萌
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系!上海
李晓萌
杨煜普
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系!上海
杨煜普
许晓鸣
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系!上海
许晓鸣
[J].
上海交通大学学报,
2001,
(02)
: 288
-
292
[3]
一种基于Agent团队的强化学习模型与应用研究
论文数:
引用数:
h-index:
机构:
蔡庆生
张波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系!合肥
张波
[J].
计算机研究与发展,
2000,
(09)
: 1087
-
1093
[4]
基于Markov对策的多Agent强化学习模型及算法研究
高阳
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
高阳
周志华
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
周志华
何佳洲
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
何佳洲
陈世福
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
陈世福
不详
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室! 南京
不详
[J].
计算机研究与发展 ,
2000,
(03)
: 257
-
263
[5]
智能协作信息技术[M]. 电子工业出版社 , 姚莉, 2002
[6]
Reinforcement learning in the multi-robot domain
Mataric, MJ
论文数:
0
引用数:
0
h-index:
0
机构:
Volen Center for Complex Systems, Computer Science Department, Brandeis University, Waltham
Mataric, MJ
[J].
AUTONOMOUS ROBOTS,
1997,
4
(01)
: 73
-
83
←
1
→