基于随机博弈的Agent协同强化学习方法

被引：4

作者：

王长缨

尹晓虎

鲍翊平

姚莉

机构：

[1] 国防科技大学管理科学与工程系

来源：

计算机工程与科学 | 2006年 / 02期

关键词：

强化学习; 多agent系统; 随机博弈; 协作;

D O I：

暂无

中图分类号：

TP181 [自动推理、机器学习];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。

引用

收藏

页码：107 / 110

页数：4

相关论文

共 2 条

[1]

Multiagent Systems: A Survey from a Machine Learning Perspective[J] . Peter Stone,Manuela Veloso.Autonomous Robots . 2000 (3)

[2]

Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)