学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于神经网络的强化学习在避障中的应用
被引:64
作者
:
论文数:
引用数:
h-index:
机构:
乔俊飞
论文数:
引用数:
h-index:
机构:
侯占军
论文数:
引用数:
h-index:
机构:
阮晓钢
机构
:
[1]
北京工业大学人工智能与机器人研究所
来源
:
清华大学学报(自然科学版)
|
2008年
/ 自然科学版期
关键词
:
移动机器人;
强化学习;
神经网络;
避障;
D O I
:
10.16511/j.cnki.qhdxxb.2008.s2.019
中图分类号
:
TP242 [机器人];
学科分类号
:
140102
[集成电路设计与设计自动化]
;
摘要
:
为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块。神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中。实验结果表明,该方法能够使移动机器人通过自学习实现自主避障。
引用
收藏
页码:1747 / 1750
页数:4
相关论文
共 1 条
[1]
Technical Note: Q-Learning.[J].Christopher J.C.H. Watkins;Peter Dayan.Machine Learning.1992, 3
←
1
→
共 1 条
[1]
Technical Note: Q-Learning.[J].Christopher J.C.H. Watkins;Peter Dayan.Machine Learning.1992, 3
←
1
→