基于免疫聚类的自动分层强化学习方法研究

被引:3
作者
沈晶
顾国昌
刘海波
机构
[1] 哈尔滨工程大学计算机科学与技术学院
关键词
分层强化学习; 自动分层; 免疫聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为解决分层强化学习中现有的自动分层方法对环境和状态空间特性依赖过强的问题,提出了一种基于免疫聚类的自动分层强化学习方法.该方法以Sutton提出的Option框架为基础,在学习的初始阶段,每个Option仅包含一个入口状态且执行平坦策略,经过若干个学习周期对环境进行充分探测后,应用免疫聚类方法对状态空间进行聚类,同时生成每个聚类空间下的Option,并在学习过程中完成内部策略的学习,从而实现自动分层.以二维有障碍栅格空间内路径规划为问题背景进行了仿真实验,仿真结果表明该方法不受状态空间的结构性和可分割性以及强化信号延迟的影响.
引用
收藏
页码:423 / 428
页数:6
相关论文
共 1 条
[1]  
Recent Advances in Hierarchical Reinforcement Learning[J] . Andrew G. Barto,Sridhar Mahadevan.Discrete Event Dynamic Systems . 2003 (1)