深度学习模型可解释性的研究进展

被引:45
作者
化盈盈 [1 ,2 ]
张岱墀 [1 ,2 ]
葛仕明 [1 ]
机构
[1] 中国科学院信息工程研究所
[2] 中国科学院大学网络空间安全学院
关键词
深度学习模型; 可解释性; 人工智能;
D O I
10.19363/J.cnki.cn10-1380/tn.2020.05.01
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
深度学习在很多人工智能应用领域中取得成功的关键原因在于,通过复杂的深层网络模型从海量数据中学习丰富的知识。然而,深度学习模型内部高度的复杂性常导致人们难以理解模型的决策结果,造成深度学习模型的不可解释性,从而限制了模型的实际部署。因此,亟需提高深度学习模型的可解释性,使模型透明化,以推动人工智能领域研究的发展。本文旨在对深度学习模型可解释性的研究进展进行系统性的调研,从可解释性原理的角度对现有方法进行分类,并且结合可解释性方法在人工智能领域的实际应用,分析目前可解释性研究存在的问题,以及深度学习模型可解释性的发展趋势。为全面掌握模型可解释性的研究进展以及未来的研究方向提供新的思路。
引用
收藏
页码:1 / 12
页数:12
相关论文
共 8 条
  • [1] 深度学习的可解释性
    吴飞
    廖彬兵
    韩亚洪
    [J]. 航空兵器, 2019, 26 (01) : 39 - 46
  • [2] Visual interpretability for deep learning:a survey
    Quan-shi ZHANG
    Song-chun ZHU
    [J]. FrontiersofInformationTechnology&ElectronicEngineering, 2018, 19 (01) : 27 - 39
  • [3] A Survey of Methods for Explaining Black Box Models[J] . Riccardo Guidotti,Anna Monreale,Salvatore Ruggieri,Franco Turini,Fosca Giannotti,Dino Pedreschi.ACM Computing Surveys (CSUR) . 2018 (5)
  • [4] Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning
    Kermany, Daniel S.
    Goldbaum, Michael
    Cai, Wenjia
    Valentim, Carolina C. S.
    Liang, Huiying
    Baxter, Sally L.
    McKeown, Alex
    Yang, Ge
    Wu, Xiaokang
    Yan, Fangbing
    Dong, Justin
    Prasadha, Made K.
    Pei, Jacqueline
    Ting, Magdalena
    Zhu, Jie
    Li, Christina
    Hewett, Sierra
    Dong, Jason
    Ziyar, Ian
    Shi, Alexander
    Zhang, Runze
    Zheng, Lianghong
    Hou, Rui
    Shi, William
    Fu, Xin
    Duan, Yaou
    Huu, Viet A. N.
    Wen, Cindy
    Zhang, Edward D.
    Zhang, Charlotte L.
    Li, Oulan
    Wang, Xiaobo
    Singer, Michael A.
    Sun, Xiaodong
    Xu, Jie
    Tafreshi, Ali
    Lewis, M. Anthony
    Xia, Huimin
    Zhang, Kang
    [J]. CELL, 2018, 172 (05) : 1122 - +
  • [5] Bank failure prediction using an accurate and interpretable neural fuzzy inference system
    Wang, Di
    Quek, Chai
    Ng, Geok See
    [J]. AI COMMUNICATIONS, 2016, 29 (04) : 477 - 495
  • [6] Interpretable Explanations of Black Boxes by Meaningful Perturbation .2 R. C. Fong,A. Vedaldi. IEEE Int. Conf. Comput . 2017
  • [7] Please explain Interpretability of black-box machine learning models .2 https://appsilon.com/please-explain-black-box . 2019
  • [8] Techniques for Interpretable Machine Learning .2 M. Du,N. Liu,X. Hu. . 2018