Q-learning算法及其在囚徒困境问题中的实现

被引:7
作者
张春阳
陈小平
刘贵全
蔡庆生
不详
机构
[1] 中国科学技术大学计算机系!合肥
关键词
机器学习; 强化学习; Q-learning算法; Agent; 囚徒困境问题; 针锋相对算法;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
Q-learning是一种优良的强化学习算法。该文首先阐述了Q-learning的基本学习机制,然后以囚徒困境问题为背景,分析、对比T Q-learning算法与TFT算法,验证了 Q-learning算法的优良特性。
引用
收藏
页码:121 / 122+128 +128
页数:3
相关论文
共 2 条
[1]  
高级人工智能[M]. 科学出版社 , 史忠植编著, 1998
[2]  
人工智能及其应用[M]. 清华大学出版社 , 蔡自兴, 1996