机器学习的可解释性

被引:53
作者
陈珂锐 [1 ]
孟小峰 [2 ]
机构
[1] 河南财经政法大学计算机与信息工程学院
[2] 中国人民大学信息学院
关键词
机器学习; 可解释性; 神经网络; 黑盒子; 模仿者模型;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
近年来,机器学习发展迅速,尤其是深度学习在图像、声音、自然语言处理等领域取得卓越成效.机器学习算法的表示能力大幅度提高,但是伴随着模型复杂度的增加,机器学习算法的可解释性越差,至今,机器学习的可解释性依旧是个难题.通过算法训练出的模型被看作成黑盒子,严重阻碍了机器学习在某些特定领域的使用,譬如医学、金融等领域.目前针对机器学习的可解释性综述性的工作极少,因此,将现有的可解释方法进行归类描述和分析比较,一方面对可解释性的定义、度量进行阐述,另一方面针对可解释对象的不同,从模型的解释、预测结果的解释和模仿者模型的解释3个方面,总结和分析各种机器学习可解释技术,并讨论了机器学习可解释方法面临的挑战和机遇以及未来的可能发展方向.
引用
收藏
页码:1971 / 1986
页数:16
相关论文
共 15 条
[1]   机器学习模型可解释性方法、应用与安全研究综述 [J].
纪守领 ;
李进锋 ;
杜天宇 ;
李博 .
计算机研究与发展, 2019, 56 (10) :2071-2096
[2]   机器学习化数据库系统研究综述 [J].
孟小峰 ;
马超红 ;
杨晨 .
计算机研究与发展, 2019, 56 (09) :1803-1820
[3]  
Explaining nonlinear classification decisions with deep Taylor decomposition[J] . Grégoire Montavon,Sebastian Lapuschkin,Alexander Binder,Wojciech Samek,Klaus-Robert Müller.Pattern Recognition . 2017
[4]  
Using sensitivity analysis and visualization techniques to open black box data mining models[J] . Paulo Cortez,Mark J. Embrechts.Information Sciences . 2013
[5]  
Further Insight Into the Incremental Value of New Markers: The Interpretation of Performance Measures and the Importance of Clinical Context[J] . Kathleen F. Kerr,Aasthaa Bansal,Margaret S. Pepe.American Journal of Epidemiology . 2012 (6)
[6]   Varieties of Justification in Machine Learning [J].
Corfield, David .
MINDS AND MACHINES, 2010, 20 (02) :291-301
[7]   Distinctive image features from scale-invariant keypoints [J].
Lowe, DG .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (02) :91-110
[8]   Survey and critique of techniques for extracting rules from trained artificial neural networks [J].
Andrews, R ;
Diederich, J ;
Tickle, AB .
KNOWLEDGE-BASED SYSTEMS, 1995, 8 (06) :373-389
[9]  
Learning defining features for categories .2 Xu Bo,Xie Chenhao,Zhang Yi,et al. Proc of the 25th Int Joint Conf on Artificial Intelligence (IJCAI 2016) . 2016
[10]  
Semantics derived automatically from language corpora necessarily contain human biases .2 Caliskan-Islam A,Bryson J J,Narayanan A. . 2016