AODE中基于强化学习的Agent协商模型

被引:12
作者
王立春
高阳
陈世福
机构
[1] 南京大学计算机软件新技术国家重点实验室南京大学计算机科学与技术系!南京
关键词
多Agent系统; 协商; 强化学习;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
AODE是我们研制的一个面向Agent的智能系统开发环境 .AODE中基于强化学习的Agent协商模型采用Markov决策过程和连续决策过程分别描述系统状态变化和特定系统状态的Agent协商过程 ,并将强化学习技术应用于Agent协商过程 .该协商模型能够描述动态环境下的多Agent协商 ,模型中所有Agent都采用元对策Q 学习算法时 ,系统能获得动态协商环境下的最优协商解 .
引用
收藏
页码:135 / 141
页数:7
相关论文
共 3 条
[1]   软件Agent的分析与建模方法 [J].
樊晓聪 ;
徐殿祥 ;
侯建民 ;
郑国梁 .
南京大学学报(自然科学版), 2000, (02) :155-162
[2]   基于Markov对策的多Agent强化学习模型及算法研究 [J].
高阳 ;
周志华 ;
何佳洲 ;
陈世福 .
计算机研究与发展, 2000, (03) :257-263
[3]   DAI中多Agent协调方法及其分类 [J].
李建民 ;
石纯一 .
计算机科学, 1998, (02) :9-12