基于先验知识的改进强化学习及其在MAS中应用

被引:2
作者
毛俊杰
刘国栋
机构
[1] 江南大学通信与控制工程学院
关键词
多智能体系统; 先验知识; 内在激励; 强化学习;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对传统的多Agent强化学习算法中,Agent学习效率低的问题,在传统强化学习算法中加入具有经验知识的函数;从心理学角度引入内部激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程。最后将此算法运用到RoboCup仿真中,仿真结果表明该算法的学习效率和收敛速度明显优于传统的强化学习。
引用
收藏
页码:156 / 158
页数:3
相关论文
共 4 条
[1]   基于经验知识的Q-学习算法 [J].
宋清昆 ;
胡子婴 .
自动化技术与应用, 2006, (11) :10-12
[2]   内在激励强化学习及其在Robocup仿真中的应用 [J].
李楠 ;
刘国栋 .
计算机仿真, 2006, (04) :160-162
[3]   多智能体系统中具有先验知识的Q学习算法 [J].
杜春侠 ;
高云 ;
张文 .
清华大学学报(自然科学版), 2005, (07) :981-984
[4]   多Agent系统在RoboCup中的应用 [J].
赵丽 ;
董红斌 .
哈尔滨师范大学自然科学学报, 2005, (02) :40-45