强化学习主要算法的研究

被引:1
作者
李瑞
机构
[1] 渝西学院数学与计算机科学系重庆永川
关键词
强化学习; 动态规划; 蒙特卡罗算法; 瞬时差分算法;
D O I
10.15998/j.cnki.issn1673-8012.2004.03.007
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
介绍了强化学习模型 ,分别提出了 7个主要的强化学习算法并讨论了它们之间的区别和联系 ,最后指出了强化学习算法中有待解决的问题
引用
收藏
页码:22 / 25
页数:4
相关论文
empty
未找到相关数据