Q-learning算法及其在囚徒困境问题中的实现

被引：7

作者：

张春阳

陈小平

刘贵全

蔡庆生

不详

机构：

[1] 中国科学技术大学计算机系!合肥

来源：

关键词：

机器学习; 强化学习; Q-learning算法; Agent; 囚徒困境问题; 针锋相对算法;

D O I：

暂无

中图分类号：

TP301.6 [算法理论];

学科分类号：

081202 ;

摘要：

Ｑ－ｌｅａｒｎｉｎｇ是一种优良的强化学习算法。该文首先阐述了Ｑ－ｌｅａｒｎｉｎｇ的基本学习机制，然后以囚徒困境问题为背景，分析、对比ＴＱ－ｌｅａｒｎｉｎｇ算法与ＴＦＴ算法，验证了Ｑ－ｌｅａｒｎｉｎｇ算法的优良特性。

引用

页码：121 / 122+128 +128

页数：3