基于强化学习的多Agent系统

被引:6
作者
唐文彬
朱淼良
机构
[1] 浙江大学人工智能研究所
[2] 浙江大学人工智能研究所 杭州
[3] 杭州
关键词
Agent; Reinforcement learning; EDP; Equation principle;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
<正> 1 引言强化学习允许自主Agent能够在没有关于任务和环境的先验知识的条件下通过不断地反射学习提高自己完成任务的能力,但是强化学习需要大量的计算,也就意味着大量的时间的消耗。对于许多实时系统的计算能力是一个大的挑战。进一步,如果是在多个Agent组成的Agent社会中,每个Agent的行动都有可能导致环境状态的改变,使得普通的相对单个
引用
收藏
页码:16 / 18
页数:3
相关论文
共 1 条
[1]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)