学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
内在激励强化学习及其在Robocup仿真中的应用
被引:3
作者
:
李楠
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学控制科学与工程研究中心
李楠
刘国栋
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学控制科学与工程研究中心
刘国栋
机构
:
[1]
江南大学控制科学与工程研究中心
来源
:
计算机仿真
|
2006年
/ 04期
关键词
:
内在激励;
强化学习;
机器人足球;
D O I
:
暂无
中图分类号
:
TP242 [机器人];
学科分类号
:
1111 ;
摘要
:
针对以往的强化学习对单步动作学习的效率较低,从心理学角度引入内在激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程。改变了传统意义上的强化学习的框架模式。在学习的过程中,不但要学习单步的动作值,同时还学连续动作的技巧值,通过构建各种“技巧”,来提高解决新问题的能力,使学习的效率得到很大的提高。最后将内在激励的强化学习运用于Robocup仿真组足球比赛当中。
引用
收藏
页码:160 / 162
页数:3
相关论文
共 3 条
[1]
基于强化学习的倒立摆起摆与平衡全过程控制
[J].
张荣
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
张荣
;
陈卫东
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
陈卫东
.
系统工程与电子技术,
2004,
(01)
:72
-76+118
[2]
机器人足球赛中基于增强学习的任务分工
[J].
论文数:
引用数:
h-index:
机构:
顾冬雷
;
陈卫东
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化研究所!上海
陈卫东
;
席裕庚
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化研究所!上海
席裕庚
.
机器人,
2000,
(06)
:482
-489
[3]
Motivation reconsidered: The concept of competence .2 R. W. White. Psychological Review . 1959
←
1
→
共 3 条
[1]
基于强化学习的倒立摆起摆与平衡全过程控制
[J].
张荣
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
张荣
;
陈卫东
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
陈卫东
.
系统工程与电子技术,
2004,
(01)
:72
-76+118
[2]
机器人足球赛中基于增强学习的任务分工
[J].
论文数:
引用数:
h-index:
机构:
顾冬雷
;
陈卫东
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化研究所!上海
陈卫东
;
席裕庚
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化研究所!上海
席裕庚
.
机器人,
2000,
(06)
:482
-489
[3]
Motivation reconsidered: The concept of competence .2 R. W. White. Psychological Review . 1959
←
1
→