加强学习

被引:2
作者
郭茂祖
陈彬
王晓龙
洪家荣
机构
[1] 哈尔滨工业大学计算机系
[2] 哈尔滨工业大学计算机系 哈尔滨
[3] 哈尔滨
[4] 哈尔滨
关键词
Reinforcement learning; Markov decision process (MDP) .Temporal difference (TD); Q-learning;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
<正>加强学习(Reinforcement Learning,简称RL)是一种重要的机器学习方法,在机器入规划、分析预测等领域有许多应用。加强学习的任务即是寻找一条策略,为行为者(agent)在一给定状况下产生一个动
引用
收藏
页码:13 / 15
页数:3
相关论文
empty
未找到相关数据