多Agent系统中强化学习的研究现状和发展趋势

被引:12
作者
赵志宏
高阳
骆斌
陈世福
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 南京大学计算机科学与技术系 南京
[3] 南京
关键词
多Agent系统; 强化学习; 算法;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
本文对有关强化学习及其在多Agent系统中的应用等方面的研究现状、关键技术、问题和发展趋势进行了综述和讨论,试图给出强化学习目前研究的重点和发展方向。主要内容包括:(1)强化学习的框架结构;(2)几个有代表性的强化学习方法;(3)多Agent系统中强化学习的应用和问题。最后讨论了多Agent系统中应用强化学习所面临的挑战。
引用
收藏
页码:23 / 27
页数:5
相关论文
共 7 条
[1]  
Multiagent Systems: A Survey from a Machine Learning Perspective[J] . Peter Stone,Manuela Veloso.Autonomous Robots . 2000 (3)
[2]   Convergence results for single-step on-policy reinforcement-learning algorithms [J].
Singh, S ;
Jaakkola, T ;
Littman, ML ;
Szepesvári, C .
MACHINE LEARNING, 2000, 38 (03) :287-308
[3]   A Probabilistic Approach to Concurrent Mapping and Localization for Mobile Robots [J].
Sebastian Thrun ;
Wolfram Burgard ;
Dieter Fox .
Machine Learning, 1998, 31 :29-53
[4]   ASYNCHRONOUS STOCHASTIC-APPROXIMATION AND Q-LEARNING [J].
TSITSIKLIS, JN .
MACHINE LEARNING, 1994, 16 (03) :185-202
[5]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
[6]   A SURVEY OF ALGORITHMIC METHODS FOR PARTIALLY OBSERVED MARKOV DECISION PROCESSES [J].
Lovejoy, William S. .
ANNALS OF OPERATIONS RESEARCH, 1991, 28 (01) :47-65
[7]  
Learning to predict by the methods of temporal differences[J] . Richard S. Sutton.Machine Learning . 1988 (1)