内在激励强化学习及其在Robocup仿真中的应用

被引：3

作者：

李楠

刘国栋

机构：

[1] 江南大学控制科学与工程研究中心

来源：

计算机仿真 | 2006年 / 04期

关键词：

内在激励; 强化学习; 机器人足球;

D O I：

暂无

中图分类号：

TP242 [机器人];

学科分类号：

1111 ;

摘要：

针对以往的强化学习对单步动作学习的效率较低,从心理学角度引入内在激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程。改变了传统意义上的强化学习的框架模式。在学习的过程中,不但要学习单步的动作值,同时还学连续动作的技巧值,通过构建各种“技巧”,来提高解决新问题的能力,使学习的效率得到很大的提高。最后将内在激励的强化学习运用于Robocup仿真组足球比赛当中。

引用

页码：160 / 162

页数：3