半自治作战agent模型及其应用研究

被引：0

作者：

杨克巍

机构：

[1] 国防科学技术大学

关键词：

半自治作战agent; 主动信息传送模型; Profit-sharing增强学习算法; 有限理性决策; 坦克作战仿真;

D O I：

暂无

年度学位：

2004

学位类型：

博士

导师：

谭跃进;

摘要：

近年军事仿真成为了部队作战模拟训练、武器装备设计、定型、评估的重要手段,本文在面向军事作战仿真系统的研究和开发中,围绕着如何建立贴近现实战场环境,以全面描述作战单元的战场活动为出发点,提出了半自治作战agent的概念,它综合了agent的自治性、主动性、社会性、智能性和作战过程中接受上级指挥控制的“受制性”两方面的特性,逼真的反映了作战单元在战场上的活动特点。利用半自治作战agent描述战场作战单元,结合现代作战样式和战场组织模式,建立了基于半自治作战agent的作战仿真系统模型。本文提出了半自治作战agent概念:一种为完成自身任务活动于动态战场环境中,具有较高自治能力但又受到环境中其它实体制约或部分控制,并可主动或被动的与环境中其它agent发生交互的agent。在此基础上设计半自治作战agent的内部模块结构,并详细分析每个组成模块所完成的功能。重点研究了构成半自治作战agent的通信、学习和有限理性决策模块,针对每个模块结合半自治作战agent的“受制性”特点,在分析传统智能agent的相关模型的基础上,提出了新的模型算法。面向战场通信和“受制性”特点,扩展KQML作为半自治作战agent的通信原语,以黑板通信和消息传送通信方式相结合为主要的通信模式,给出了基于半自治作战agent的通信模型SCACM(Semi Autonomous Combat Agent Communication Model)。并根据具体的作战单元的通信过程,提出了主动信息传送的通信方法,满足了战场通信实时、准确和减少冗余的要求,大大提高了通信效率。在以agent通信作为保障的前提下,以集合覆盖理论为基础建立了任务分配协作模型,并给出了具有共同目标的agent单对单的协作请求模型,均给出了实现算法。 Agent具有学习属性是agent在活动过程中动态提高自身能力的一种手段,也是agent具备适应性的重要表现,在比较Profit-sharing增强学习算法和Q-learning算法的奖励机制原理和应用范围的基础上,提出了基于半自治作战agent的profit-sharing增强学习模型,避免了一般学习模型中可能导致的感知混淆(perceptual aliasing)和学习一致性(concurrent learning)问题。利用半自治作战agent的“受制性”特点,将战场环境中agent间的角色分配与活动交互应用于该学习模型中,通过具有学习能力的agent之间的共享经验知识、上级agent发布命令传递有效信息等方式,带动整个系统中agent能力的提升,从而显著提高整个作战agent系统完成任务的能力。现实的战场环境中存在很多不确定性和不可预测性,导致环境状态的转移不是一个完全的马尔可夫过程,据此提出了基于有限理性的期望效用决策模型。一方面使用有限理性agent来处理对于环境的不完全认识,并结合使用定量化的期望效用理论模型代替一般智能agent使用的逻辑推理决策方法,更加适合于战场作战过程中的行为决策。文章最后介绍了正在研究开发的一个坦克作战效能评估系统,将半自治作战agent作战模型应用于坦克作战仿真子系统中,建立了基于HLA架构上的坦克对抗作战联邦,利

引用

页数：130

共 12 条

[1]

目标选择的一个优化模型 [J].