基于非时序观察数据的因果关系发现综述

被引:37
作者
蔡瑞初 [1 ]
陈薇 [1 ]
张坤 [2 ]
郝志峰 [1 ,3 ]
机构
[1] 广东工业大学计算机学院
[2] 卡内基梅隆大学哲学系
[3] 佛山科学技术学院数学与大数据学院
关键词
因果关系; 因果关系发现; 观察数据; 结构学习; 加性噪声模型; 人工智能; 机器学习;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
探索和发现事物间的因果关系是数据科学的一个核心问题,其中蕴含着丰富的科学发现机会和巨大的商业价值.基于非时序观察数据的因果关系发现方法能够从被动观察获得的数据中发现变量之间的因果关系,因而在各领域有广泛应用.这一类方法在过去三十年取得很大进展,已经成为因果关系发现的重要途径.文中从因果关系方向推断、高维数据上的误发现率控制和不完全观察数据上的隐变量检测这三个研究热点出发,对现有的因果关系模型与假设、基于约束的方法、基于因果函数模型的方法和混合型方法这三大类方法,验证与测评涉及的数据集及工具等方面进行了详尽的介绍与分析.基于约束的方法主要包括因果骨架学习和因果方向推断两个阶段:首先基于因果马尔可夫假设,采用条件独立性检验学习变量之间的因果骨架,然后基于奥卡姆剃刀准则利用V-结构确定因果方向,典型的算法有Peter-Clark算法、Inductive Causation等,这类方法的主要不足是存在部分无法判断的因果关系方向,即存在Markov等价类难题.基于因果函数模型的方法则基于数据的因果产生机制假设,在构建变量之间的因果函数模型的基础之上,基于噪声的非高斯性、原因变量与噪声的独立性、原因变量分布与因果函数梯度的独立性等因果假设推断变量之间的因果关系方向,典型的算法有针对线性非高斯无环数据的Linear NonGaussian Acyclic Model算法、针对后非线性数据的Post-NonLinear算法、适用于非线性或离散数据的Additive Noise Model等,这类方法的主要不足是需要较为严格的数据因果机制假设,且Additive Noise Model等方法主要适用于低维数据场景.混合型方法则希望充分发挥基于约束的方法和基于因果函数类方法的优势,分别采用基于约束的方法进行全局结构学习和基于因果函数模型进行局部结构学习和方向推断,典型的算法有SADA、MCDSL等,理论分析较为不足是这类方法目前遇到的主要困难.最后,文中还基于研究现状分析讨论了因果方向推断、高维数据上的误发现率控制、隐变量发现、与机器学习的关系等未来可能的研究方向.
引用
收藏
页码:1470 / 1490
页数:21
相关论文
共 24 条
[1]   基于典型因果推断算法的无线网络性能优化 [J].
郝志峰 ;
陈薇 ;
蔡瑞初 ;
黄瑞慧 ;
温雯 ;
王丽娟 .
计算机应用, 2016, 36 (08) :2114-2120
[2]   含隐变量和选择偏差的图模型中的因果推断 [J].
赵慧 ;
郑忠国 ;
许静 .
北京大学学报(自然科学版), 2006, (05) :584-589
[3]  
A Causal Approach to the Study of TCP Performance[J] . Hadrien Hours,Ernst Biersack,Patrick Loiseau.ACM Transactions on Intelligent Systems and Techn . 2015 (2)
[4]  
Learning Perceptual Causality from Video[J] . Amy Fire,Song-Chun Zhu.ACM Transactions on Intelligent Systems and Techn . 2015 (2)
[5]  
Concept drift mining of portfolio selection factors in stock market[J] . Yong Hu,Kang Liu,Xiangzhou Zhang,Kang Xie,Weiqi Chen,Yuran Zeng,Mei Liu.Electronic Commerce Research and Applications . 2015
[6]   Evaluation Without Ground Truth in Social Media Research [J].
Zafarani, Reza ;
Liu, Huan .
COMMUNICATIONS OF THE ACM, 2015, 58 (06) :54-60
[7]  
A causal feature selection algorithm for stock prediction modeling[J] . Xiangzhou Zhang,Yong Hu,Kang Xie,Shouyang Wang,E.W.T. Ngai,Mei Liu.Neurocomputing . 2014
[8]   The methodology of Dynamic Uncertain Causality Graph for intelligent diagnosis of vertigo [J].
Dong, Chunling ;
Wang, Yanjun ;
Zhang, Qin ;
Wang, Ningyu .
COMPUTER METHODS AND PROGRAMS IN BIOMEDICINE, 2014, 113 (01) :162-174
[9]  
ParceLiNGAM: A Causal Ordering Method Robust Against Latent Confounders[J] . Tatsuya Tashiro.Neural Computation . 2014 (1)
[10]  
Social Influence Bias: A Randomized Experiment[J] . Lev Muchnik,Sinan Aral,Sean J. Taylor.Science . 2013 (6146)