基于BDI框架的多Agent动态协作模型与应用研究

被引:13
作者
刘新宇
洪炳鎔
机构
[1] 哈尔滨工业大学计算机科学和工程系,哈尔滨工业大学计算机科学和工程系哈尔滨,哈尔滨
关键词
多Agent; 强化学习; BDI模型; AFS神经网络; 模拟退火算法; 足球机器人;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
近年来 ,多 Agent学习已经成为人工智能和机器学习研究方向发展最迅速的领域之一 .将强化学习和BDI思维状态模型相结合 ,形成针对多 Agent的动态协作模型 .在此模型中 ,个体最优化概念失去其意义 ,因为每个 Agent的回报 ,不仅取决于自身 ,而且取决于其它 Agent的选择 .模型采用 AFS神经网络对输入状态空间进行压缩 ,提高强化学习的收敛速度 .与此同时 ,利用模拟退火算法启发性地指明动作空间搜索方向 ,使其跳出局部最小点 ,避免迭代步数的无限增长 .理论分析和在机器人足球领域的成功应用 ,都证明了基于 BDI框架的多 Agent动态协作模型的有效性
引用
收藏
页码:797 / 801
页数:5
相关论文
共 3 条
[1]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
[2]  
Layered learning in multi -agent systems[Ph D dissertation] .2 P Stone. . 1998
[3]  
Competitive Markov Decision Process .2 Filar Jerzy,Vrieze Koos. Berlin, Germany: Springer-Verlag . 1996