基于递阶强化学习的自主机器人路径规划智能体

被引:6
作者
王文玺 [1 ]
肖世德 [1 ]
孟祥印 [1 ]
陈应松 [1 ]
张卫华 [2 ]
机构
[1] 西南交通大学机械工程学院
[2] 西南交通大学牵引动力国家重点实验室
关键词
智能体; 强化学习; 意识模型; 路径规划;
D O I
10.13196/j.cims.2009.06.177.wangwx.022
中图分类号
TP242 [机器人];
学科分类号
1111 ;
摘要
递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。通过引入启发式算法思想,对一种递阶强化学习方法进行改进,使得智能体在学习过程中融入了历史信息,提高了学习效率,解决了在庞大状态空间和动态变化环境中对智能体进行最优行为策略学习的问题。以扩展的信念、愿望和意图意识模型为基础,提出了一种具有主动性、自治性、反应性、社会性的自主机器人路径规划智能体体系结构,通过仿真实验,证明了路径规划智能体的可行性和有效性。
引用
收藏
页码:1215 / 1221
页数:7
相关论文
共 5 条
[1]   多智能体系统中具有先验知识的Q学习算法 [J].
杜春侠 ;
高云 ;
张文 .
清华大学学报(自然科学版), 2005, (07) :981-984
[2]   理性Agent的意图维护模型 [J].
胡山立 ;
石纯一 .
计算机研究与发展, 2001, (09) :1046-1050
[3]   一种基于强化学习的学习Agent [J].
李宁 ;
高阳 ;
陆鑫 ;
陈世福 .
计算机研究与发展, 2001, (09) :1051-1056
[4]   自主机器人的强化学习研究进展 [J].
陈卫东 ;
席裕庚 ;
顾冬雷 .
机器人, 2001, (04) :379-384
[5]   Agent的意图模型 [J].
胡山立 ;
fzu.edu.cn ;
石纯一 .
软件学报, 2000, (07) :965-970