学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
强化学习主要算法的研究
被引:1
作者
:
李瑞
论文数:
0
引用数:
0
h-index:
0
机构:
渝西学院数学与计算机科学系重庆永川
李瑞
机构
:
[1]
渝西学院数学与计算机科学系重庆永川
来源
:
渝西学院学报(自然科学版)
|
2004年
/ 03期
关键词
:
强化学习;
动态规划;
蒙特卡罗算法;
瞬时差分算法;
D O I
:
10.15998/j.cnki.issn1673-8012.2004.03.007
中图分类号
:
TP301.6 [算法理论];
学科分类号
:
081202 ;
摘要
:
介绍了强化学习模型 ,分别提出了 7个主要的强化学习算法并讨论了它们之间的区别和联系 ,最后指出了强化学习算法中有待解决的问题
引用
收藏
页码:22 / 25
页数:4
相关论文
未找到相关数据
未找到相关数据