基于随机博弈的Agent协同强化学习方法

被引:4
作者
王长缨
尹晓虎
鲍翊平
姚莉
机构
[1] 国防科技大学管理科学与工程系
关键词
强化学习; 多agent系统; 随机博弈; 协作;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。
引用
收藏
页码:107 / 110
页数:4
相关论文
共 2 条
[1]  
Multiagent Systems: A Survey from a Machine Learning Perspective[J] . Peter Stone,Manuela Veloso.Autonomous Robots . 2000 (3)
[2]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)