基于神经网络的强化学习在避障中的应用

被引：64

作者：

乔俊飞

侯占军

阮晓钢

机构：

[1] 北京工业大学人工智能与机器人研究所

来源：

清华大学学报(自然科学版) | 2008年 / 自然科学版期

关键词：

移动机器人; 强化学习; 神经网络; 避障;

D O I：

10.16511/j.cnki.qhdxxb.2008.s2.019

中图分类号：

TP242 [机器人];

学科分类号：

140102 [集成电路设计与设计自动化];

摘要：

为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块。神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中。实验结果表明,该方法能够使移动机器人通过自学习实现自主避障。

引用

页码：1747 / 1750

页数：4