AlphaGo技术原理分析及人工智能军事应用展望

被引:72
作者
陶九阳 [1 ,2 ]
吴琳 [1 ]
胡晓峰 [1 ]
机构
[1] 国防大学信息作战与指挥训练教研部
[2] 解放军理工大学指挥信息系统学院
关键词
AlphaGo; 深度学习; 增强学习; 态势感知; OODA循环;
D O I
暂无
中图分类号
E919 [其他学科在军事上的应用]; TP18 [人工智能理论];
学科分类号
1111 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
以"深蓝"的技术原理为比对,研究了AlphaGo有监督学习策略网络、快速走子模型、增强学习策略网络和价值网络等核心模块,较为详细地分析了策略网络、价值网络引导的蒙特卡洛树搜索算法的实现;以AlphaGo的技术突破为起点,展望了人工智能在物理域、信息域、认知域和社会域上的可能应用,分析了美国国防部高级研究计划局资助的人工智能军事应用项目;以OODA循环理论为基础,研究了人工智能应用于军事领域可能会带来的颠覆性效果.
引用
收藏
页码:114 / 120
页数:7
相关论文
共 6 条
[1]   Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond [J].
FeiYue Wang ;
Jun Jason Zhang ;
Xinhu Zheng ;
Xiao Wang ;
Yong Yuan ;
Xiaoxiao Dai ;
Jie Zhang ;
Liuqing Yang .
IEEE/CAAJournalofAutomaticaSinica, 2016, 3 (02) :113-120
[2]  
博弈与信息[M]. 中国人民大学出版社 , (美) 拉斯穆森 (Rasmusen, 2009
[3]  
Deep Blue[J] . Murray Campbell,A.Joseph Hoane,Feng-hsiung Hsu.Artificial Intelligence . 2001 (1)
[4]  
Simple statistical gradient-following algorithms for connectionist reinforcement learning[J] . Ronald J. Williams.Machine Learning . 1992 (3)
[5]  
Searching for solutions in games and artifcial intelligence. ALLIS L V. University Limburg . 1994
[6]  
Deep reinforcement learning with double Q-learning. van Hasselt H,Guez A,Silver D. Proceedings of the 30th AAAI Conference on Artificial Intelligence . 2016