基于深度强化学习的作战辅助决策研究

被引：23

作者：

周来

靳晓伟

郑益凯

机构：

[1] 上海机电工程研究所

来源：

空天防御 | 2018年 / 1卷 / 01期

关键词：

指挥控制; 智能决策; 深度学习; 强化学习;

D O I：

暂无

中图分类号：

E91 [军事技术基础科学];

学科分类号：

摘要：

面对瞬息万变的战场,如何有效地利用智能化技术实现计算机辅助决策,已经成为制约作战指挥控制技术发展的瓶颈。通过深入分析作战决策制定过程,将其转化为一个序列多步决策问题,使用深度学习方法提取包含指挥员情绪、行为和战法演变过程决策状态在内的战场特征向量,基于强化学习方法对策略状态行动空间进行搜索并对决策状态进行评估,直到获得最佳的行动决策序列,旨在实现未来战场"机脑对人脑"的博弈优势。

引用

页码：31 / 35

页数：5

共 10 条

[1] 军事辅助决策模型及其求解技术研究进展
于新源
许波
姜再明
[J]. 战术导弹技术, 2016, (05) : 1 - 9
[2] 基于规则的CGF实体行为建模技术
郝立山
夏洪波
田书超
郭宗峰
贾会琰
[J]. 火力与指挥控制, 2015, 40 (01) : 96 - 99
[3] 深度学习研究进展
刘建伟
刘媛
罗雄麟
[J]. 计算机应用研究, 2014, 31 (07) : 1921 - 1930+1942
[4] 融合规则推理和案例推理的作战指挥决策建模
樊延平
郭齐胜
穆歌
[J]. 火力与指挥控制, 2013, 38 (09) : 108 - 111
[5] 深度学习的昨天、今天和明天
余凯
贾磊
陈雨强
徐伟
[J]. 计算机研究与发展, 2013, 50 (09) : 1799 - 1804
[6] 深度学习研究综述
孙志军
薛磊
许阳明
王正
[J]. 计算机应用研究, 2012, 29 (08) : 2806 - 2810
[7] 基于规则推理的海战仿真实体决策方法
吴扬波
贾全
王文广
朱一凡
[J]. 火力与指挥控制, 2009, (08) : 30 - 33
[8] 基于预定指挥规则的指挥决策模型研究
谭亚新
王成
范锐
王精业
[J]. 系统仿真学报, 2008, (14) : 3820 - 3824
[9] 行为可变性在指挥决策仿真中的运用研究
张洪钢
杨艾军
张勇
[J]. 军事运筹与评估, 2008, (01) : 69 - 74
[10] 基于案例推理方法在态势分析中的应用研究
唐雪松
郭立红
陈长喜
[J]. 计算机测量与控制, 2006, (12) : 1723 - 1725

← 1 →