提高强化学习速度的方法研究

被引:7
作者
张汝波
机构
[1] 哈尔滨工程大学计算机系哈尔滨
基金
黑龙江省自然科学基金;
关键词
强化学习; 机器学习; Q-学习; 自适应启发评价方法;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
强化学习一词出自于行为心理学,这门学科把学习看作为反复试验的过程,以便把环境的状态映射为动作。强化学习的这种特性必然增加智能系统的困难性,学习时间增长。强化学习学习速度较慢的原因是没有明确的监督信号。因此,强化学习系统在与环境交互时不得不采取反复试验的方法依靠外部评价信号来调整自己的行为。智能系统必然经过很长的学习过程。如何提高强化学习速度是一个最重要的研究问题。该文从几个方面来讨论提高强化学习速度的方法。
引用
收藏
页码:38 / 40
页数:3
相关论文
共 3 条
[1]  
强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
[2]  
Self-Improving Reactive Agents Based on Reinforcement Learning, Planning and Teaching[J] . Long-Ji Lin.Machine Learning . 1992 (3)
[3]  
Integrated architectures for learning, planning, and reacting based on approximating dynamic programming .2 Sutton R. S. Proceedings of the Seventh International Conference on Machine Learning . 1990