学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
Q-learning算法及其在囚徒困境问题中的实现
被引:7
作者
:
张春阳
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机系!合肥
张春阳
论文数:
引用数:
h-index:
机构:
陈小平
论文数:
引用数:
h-index:
机构:
刘贵全
蔡庆生
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机系!合肥
蔡庆生
不详
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机系!合肥
不详
机构
:
[1]
中国科学技术大学计算机系!合肥
来源
:
计算机工程与应用
|
2001年
/ 13期
关键词
:
机器学习;
强化学习;
Q-learning算法;
Agent;
囚徒困境问题;
针锋相对算法;
D O I
:
暂无
中图分类号
:
TP301.6 [算法理论];
学科分类号
:
081202 ;
摘要
:
Q-learning是一种优良的强化学习算法。该文首先阐述了Q-learning的基本学习机制,然后以囚徒困境问题为背景,分析、对比T Q-learning算法与TFT算法,验证了 Q-learning算法的优良特性。
引用
收藏
页码:121 / 122+128 +128
页数:3
相关论文
共 2 条
[1]
高级人工智能[M]. 科学出版社 , 史忠植编著, 1998
[2]
人工智能及其应用[M]. 清华大学出版社 , 蔡自兴, 1996
←
1
→
共 2 条
[1]
高级人工智能[M]. 科学出版社 , 史忠植编著, 1998
[2]
人工智能及其应用[M]. 清华大学出版社 , 蔡自兴, 1996
←
1
→