多Agent协作的强化学习模型和算法

被引:6
作者
刘菲
曾广周
宋言伟
机构
[1] 山东大学计算机科学与技术学院
关键词
协作学习; 强化学习; 多Agent学习; 学习模型; 学习算法;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并做出相应的决策,进而达成最优的联合动作策略。最后,通过对猎人-猎物追逐问题的仿真试验验证了该算法的收敛性,表明这种学习算法是一种高效、快速的学习方法。
引用
收藏
页码:156 / 158+186 +186
页数:4
相关论文
共 1 条
[1]   一种基于Agent团队的强化学习模型与应用研究 [J].
蔡庆生 ;
张波 .
计算机研究与发展, 2000, (09) :1087-1093