进化博弈中多代理人强化学习模型

被引:23
作者
刘伟兵 [1 ]
王先甲 [2 ,3 ]
机构
[1] 武汉大学政治与公共管理学院
[2] 武汉大学经济与管理学院
[3] 武汉科技大学冶金工业过程系统科学实验室
关键词
博弈论; 进化博弈; 强化学习; Q-学习;
D O I
暂无
中图分类号
F224.32 [博弈论];
学科分类号
摘要
将强化学习引入到进化博弈中,建立了进化博弈中的多代理人强化学习模型,并基于Q-学习给出了算法流程,仿真算例的结果表明多代理人强化学习模型能使得博弈人不断学习、寻求最优策略.
引用
收藏
页码:28 / 33
页数:6
相关论文
共 4 条
  • [1] Another approach to mutation and learning in games
    Amir, M
    Berninghaus, SK
    [J]. GAMES AND ECONOMIC BEHAVIOR, 1996, 14 (01) : 19 - 43
  • [2] Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
  • [3] Emergence of cooperation and evoluti -onary stability in finite populations. Nowak M.A,Sasaki A,Taylor C. et al. Nature . 2004
  • [4] Ants Can Play Prisoner’’’’s Dilemma. Thlol Y,Acan A. 2003IEEE International Conference on Systems.Man and Cybernetics . 2003