半自治作战agent模型及其应用研究

被引:0
作者
杨克巍
机构
[1] 国防科学技术大学
关键词
半自治作战agent; 主动信息传送模型; Profit-sharing增强学习算法; 有限理性决策; 坦克作战仿真;
D O I
暂无
年度学位
2004
学位类型
博士
导师
摘要
近年军事仿真成为了部队作战模拟训练、武器装备设计、定型、评估的重要手段,本文在面向军事作战仿真系统的研究和开发中,围绕着如何建立贴近现实战场环境,以全面描述作战单元的战场活动为出发点,提出了半自治作战agent的概念,它综合了agent的自治性、主动性、社会性、智能性和作战过程中接受上级指挥控制的“受制性”两方面的特性,逼真的反映了作战单元在战场上的活动特点。利用半自治作战agent描述战场作战单元,结合现代作战样式和战场组织模式,建立了基于半自治作战agent的作战仿真系统模型。 本文提出了半自治作战agent概念:一种为完成自身任务活动于动态战场环境中,具有较高自治能力但又受到环境中其它实体制约或部分控制,并可主动或被动的与环境中其它agent发生交互的agent。在此基础上设计半自治作战agent的内部模块结构,并详细分析每个组成模块所完成的功能。重点研究了构成半自治作战agent的通信、学习和有限理性决策模块,针对每个模块结合半自治作战agent的“受制性”特点,在分析传统智能agent的相关模型的基础上,提出了新的模型算法。面向战场通信和“受制性”特点,扩展KQML作为半自治作战agent的通信原语,以黑板通信和消息传送通信方式相结合为主要的通信模式,给出了基于半自治作战agent的通信模型SCACM(Semi Autonomous Combat Agent Communication Model)。并根据具体的作战单元的通信过程,提出了主动信息传送的通信方法,满足了战场通信实时、准确和减少冗余的要求,大大提高了通信效率。在以agent通信作为保障的前提下,以集合覆盖理论为基础建立了任务分配协作模型,并给出了具有共同目标的agent单对单的协作请求模型,均给出了实现算法。 Agent具有学习属性是agent在活动过程中动态提高自身能力的一种手段,也是agent具备适应性的重要表现,在比较Profit-sharing增强学习算法和Q-learning算法的奖励机制原理和应用范围的基础上,提出了基于半自治作战agent的profit-sharing增强学习模型,避免了一般学习模型中可能导致的感知混淆(perceptual aliasing)和学习一致性(concurrent learning)问题。利用半自治作战agent的“受制性”特点,将战场环境中agent间的角色分配与活动交互应用于该学习模型中,通过具有学习能力的agent之间的共享经验知识、上级agent发布命令传递有效信息等方式,带动整个系统中agent能力的提升,从而显著提高整个作战agent系统完成任务的能力。 现实的战场环境中存在很多不确定性和不可预测性,导致环境状态的转移不是一个完全的马尔可夫过程,据此提出了基于有限理性的期望效用决策模型。一方面使用有限理性agent来处理对于环境的不完全认识,并结合使用定量化的期望效用理论模型代替一般智能agent使用的逻辑推理决策方法,更加适合于战场作战过程中的行为决策。 文章最后介绍了正在研究开发的一个坦克作战效能评估系统,将半自治作战agent作战模型应用于坦克作战仿真子系统中,建立了基于HLA架构上的坦克对抗作战联邦,利
引用
收藏
页数:130
共 12 条
[1]
目标选择的一个优化模型 [J].
王正元 ;
谭跃进 ;
狄东宁 ;
岑凯辉 .
国防科技大学学报, 2002, (05) :88-92
[2]
计算机生成兵力研究进展 [J].
杨立功 ;
郭齐胜 .
计算机仿真, 2000, (03) :4-7+14
[3]
多Agent合作机制与合作结构研究 [D]. 
李常洪 .
天津大学,
2003
[4]
动态环境下分布式智能系统的任务协作理论研究 [D]. 
刘海龙 .
浙江大学,
2001
[5]
基于Agent的智能交通控制策略与可视化动态仿真研究 [D]. 
孙晋文 .
中国农业大学,
2001
[6]
Technical Note: Q-Learning.[J].Christopher J.C.H. Watkins;Peter Dayan.Machine Learning.1992, 3
[7]
Credit assignment in rule discovery systems based on genetic algorithms.[J].John J. Grefenstette.Machine Learning.1988, 2
[8]
Learning to predict by the methods of temporal differences.[J].Richard S. Sutton.Machine Learning.1988, 1
[9]
现代作战模拟.[M].徐学文;王寿云著;.科学出版社.2001,
[10]
智能主体及其应用.[M].史忠植著;.科学出版社.2000,