基于强化学习的倒立摆起摆与平衡全过程控制

被引:7
作者
张荣
陈卫东
机构
[1] 上海交通大学自动化系
[2] 上海交通大学自动化系 上海
[3] 上海
关键词
强化学习; 倒立摆; 非线性控制;
D O I
暂无
中图分类号
TP13 [自动控制理论];
学科分类号
0711 ; 071102 ; 0811 ; 081101 ; 081103 ;
摘要
倒立摆的控制是一种典型的非线性控制问题。本文的目标是在假设不知道任何倒立摆模型的前提下,采用强化学习控制器实现倒立摆的起摆和平衡的全过程控制。为提高学习效率,采用了任务分解的方法,将整个控制任务分解为起摆和平衡两个子任务,对于不同的子任务根据其特点采用不同的强化学习算法。在Matlab/Simulink上进行仿真实验,结果证明,该方法在合理的时间内可以学习到成功的控制方法。
引用
收藏
页码:72 / 76+118 +118
页数:6
相关论文
共 3 条
[1]  
Incremental multi-step Q-learning[J] . Jing Peng,Ronald J. Williams.Machine Learning . 1996 (1)
[2]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
[3]  
Swinging up Control of Inverted Pendulum Using Pseudo-State Feedback. Furuta Yarnakita M, Kobayashi S. Systems and Control Letters . 1992