内在激励强化学习及其在Robocup仿真中的应用

被引:3
作者
李楠
刘国栋
机构
[1] 江南大学控制科学与工程研究中心
关键词
内在激励; 强化学习; 机器人足球;
D O I
暂无
中图分类号
TP242 [机器人];
学科分类号
1111 ;
摘要
针对以往的强化学习对单步动作学习的效率较低,从心理学角度引入内在激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程。改变了传统意义上的强化学习的框架模式。在学习的过程中,不但要学习单步的动作值,同时还学连续动作的技巧值,通过构建各种“技巧”,来提高解决新问题的能力,使学习的效率得到很大的提高。最后将内在激励的强化学习运用于Robocup仿真组足球比赛当中。
引用
收藏
页码:160 / 162
页数:3
相关论文
共 3 条
[1]   基于强化学习的倒立摆起摆与平衡全过程控制 [J].
张荣 ;
陈卫东 .
系统工程与电子技术, 2004, (01) :72-76+118
[2]   机器人足球赛中基于增强学习的任务分工 [J].
顾冬雷 ;
陈卫东 ;
席裕庚 .
机器人, 2000, (06) :482-489
[3]  
Motivation reconsidered: The concept of competence .2 R. W. White. Psychological Review . 1959