一种基于意图跟踪和强化学习的agent模型

被引:3
作者
续爽
贾云得
机构
[1] 北京理工大学信息科学技术学院计算机科学工程系
[2] 北京理工大学信息科学技术学院计算机科学工程系 北京
[3] 北京
关键词
多智能体系统; 意图跟踪; Q-学习; BDI模型;
D O I
10.15918/j.tbit1001-0645.2004.08.007
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对动态对抗的多agent系统(MAS)环境中agent行为前摄性较差的问题,提出了一种将意图跟踪和强化学习相结合的agent模型.该模型将对手信息和环境信息分开处理,在agent的BDI心智模型中引入了Q-学习机制应对环境变化;在强化学习的基础上注重对对手和对手团队的意图跟踪,改进Tambe的意图跟踪理论,针对特定对抗环境中的对手行为建立对手模型,跟踪对手和对手团队的意图,预测对手目标,以调整自身行为.实验证明,所提出的agent模型具有更强的自主性和适应性,在动态对抗系统中具有更强的生存能力.
引用
收藏
页码:679 / 682
页数:4
相关论文
共 1 条
[1]  
智能主体及其应用.[M].史忠植著;.科学出版社.2000,