基于人工情感的Q-学习算法在机器人行为决策中的应用

被引:5
作者
谷学静
高贝贝
朱朝月
机构
[1] 华北理工大学电气工程学院
关键词
强化学习; Q-学习算法; 人工情感; 机器人; 最优控制策略;
D O I
10.19557/j.cnki.1001-9944.2015.07.004
中图分类号
TP242 [机器人]; TP18 [人工智能理论];
学科分类号
1111 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
为了提高经典强化学习算法在机器人行为最优控制策略中学习的效率和收敛速度,在利用环境模型提高强化学习速度方法的基础上,将人类情感具有的趋利避害生存机理应用于环境模型经验知识的学习中,提出了基于人工情感的Q-学习算法,并将该算法应用于机器人的行为决策。在有障碍的二维栅格环境下对机器人路径寻优进行了仿真测试,仿真实验结果表明该算法较基于环境模型的Q-学习算法具有更高的学习效率和收敛速度。其改进算法对于提高机器人自主决策能力具有较高的理论意义及推广应用价值。
引用
收藏
页码:13 / 16+48 +48
页数:5
相关论文
共 9 条
[1]   情感可以计算——情感计算综述 [J].
张迎辉 ;
林学誾 .
计算机科学, 2008, (05) :5-8
[2]   人工情感研究综述 [J].
王国江 ;
王志良 ;
杨国亮 ;
王玉洁 ;
陈锋军 .
计算机应用研究, 2006, (11) :7-11
[3]   人工心理与人工情感 [J].
王志良 .
智能系统学报, 2006, (01) :38-43
[4]   基于随机事件处理的情感建模研究 [J].
王飞 ;
王志良 ;
赵积春 ;
程宁 .
微计算机信息, 2005, (03) :101-102
[5]   强化学习研究综述 [J].
高阳 ;
陈世福 ;
陆鑫 .
自动化学报, 2004, (01) :86-100
[6]   提高强化学习速度的方法研究 [J].
张汝波 .
计算机工程与应用, 2001, (22) :38-40
[7]  
基于情感计算的机器人学习系统研究[D]. 王为.浙江工业大学. 2009
[8]  
机器学习理论、方法及应用[M]. 科学出版社 , 王雪松, 2009
[9]  
The emotional brain .2 Ledoux J,Bemporad J R. Journal of the American Academy of Psychoanalysis . 1997