基于先验知识的改进强化学习及其在MAS中应用

被引：2

作者：

毛俊杰

刘国栋

机构：

[1] 江南大学通信与控制工程学院

来源：

计算机工程与应用 | 2008年 / 24期

关键词：

多智能体系统; 先验知识; 内在激励; 强化学习;

D O I：

暂无

中图分类号：

TP181 [自动推理、机器学习];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

针对传统的多Agent强化学习算法中,Agent学习效率低的问题,在传统强化学习算法中加入具有经验知识的函数;从心理学角度引入内部激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程。最后将此算法运用到RoboCup仿真中,仿真结果表明该算法的学习效率和收敛速度明显优于传统的强化学习。

引用

页码：156 / 158

页数：3

共 4 条

[1] 基于经验知识的Q-学习算法 [J].