加强学习

被引：2

作者：

郭茂祖

陈彬

王晓龙

洪家荣

机构：

[1] 哈尔滨工业大学计算机系

[2] 哈尔滨工业大学计算机系哈尔滨

[3] 哈尔滨

[4] 哈尔滨

来源：

关键词：

Reinforcement learning; Markov decision process (MDP) .Temporal difference (TD); Q-learning;

D O I：

暂无

中图分类号：

TP181 [自动推理、机器学习];

学科分类号：

摘要：

<正>加强学习(Reinforcement Learning,简称RL)是一种重要的机器学习方法,在机器入规划、分析预测等领域有许多应用。加强学习的任务即是寻找一条策略,为行为者(agent)在一给定状况下产生一个动

引用

页码：13 / 15

页数：3