学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
加强学习
被引:2
作者
:
郭茂祖
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系
郭茂祖
陈彬
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系
陈彬
王晓龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系
王晓龙
洪家荣
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系
洪家荣
机构
:
[1]
哈尔滨工业大学计算机系
[2]
哈尔滨工业大学计算机系 哈尔滨
[3]
哈尔滨
[4]
哈尔滨
来源
:
计算机科学
|
1998年
/ 03期
关键词
:
Reinforcement learning;
Markov decision process (MDP) .Temporal difference (TD);
Q-learning;
D O I
:
暂无
中图分类号
:
TP181 [自动推理、机器学习];
学科分类号
:
摘要
:
<正>加强学习(Reinforcement Learning,简称RL)是一种重要的机器学习方法,在机器入规划、分析预测等领域有许多应用。加强学习的任务即是寻找一条策略,为行为者(agent)在一给定状况下产生一个动
引用
收藏
页码:13 / 15
页数:3
相关论文
未找到相关数据
未找到相关数据