进化博弈中多代理人强化学习模型

被引：23

作者：

刘伟兵 ^{[1
]}

王先甲 ^{[2
,3
]}

机构：

[1] 武汉大学政治与公共管理学院

[2] 武汉大学经济与管理学院

[3] 武汉科技大学冶金工业过程系统科学实验室

来源：

关键词：

博弈论; 进化博弈; 强化学习; Q-学习;

D O I：

暂无

中图分类号：

F224.32 [博弈论];

学科分类号：

摘要：

将强化学习引入到进化博弈中,建立了进化博弈中的多代理人强化学习模型,并基于Q-学习给出了算法流程,仿真算例的结果表明多代理人强化学习模型能使得博弈人不断学习、寻求最优策略.

引用

页码：28 / 33

页数：6

共 4 条

[1] Another approach to mutation and learning in games
Amir, M
Berninghaus, SK
[J]. GAMES AND ECONOMIC BEHAVIOR, 1996, 14 (01) : 19 - 43
[2] Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
[3] Emergence of cooperation and evoluti -onary stability in finite populations. Nowak M.A,Sasaki A,Taylor C. et al. Nature . 2004
[4] Ants Can Play Prisoner’’’’s Dilemma. Thlol Y,Acan A. 2003IEEE International Conference on Systems.Man and Cybernetics . 2003