因果关系一直是人类认识世界的基本方式和现代科学的基石,可以帮助我们理解很多复杂的现实场景。与相关关系对比,因果关系严格区分了“原因”变量和“结果”变量,在揭示事物发生机制、指导干预行为等方面有相关关系不能替代的重要作用。
认识事物间的因果关系,最直接的方法是做随机实验,但在现实生活中,随机实验有时不具备可操作性,我们越来越希望能够从观测数据中得到因果关系,这其中最基本的核心点是需要找到有助于我们发现因果关系的额外信息,建立起因果结构和观测的统计数据之间的桥梁。下面介绍三种常用的方法:基于约束的方法、基于因果函数模型的方法和混合型方法。
现实场景中,经常有许多存在隐变量的情况,如果数据是线性非高斯的,可将独立噪声条件扩展到广义独立噪声条件,通过找到隐变量的代理变量做回归,恢复数据的因果结构。具体步骤包括找到共享同样的隐变量父节点的观察变量cluster,根据隐变量与观察变量cluster的关系,找到不用隐变量之间的关系。
因果性学习在人工智能中的应用也日益重要。正如图灵奖得奖者Pearl Judea提出的“因果关系之梯”中特别指出,我们当前的机器学习只处于第一层,只是“弱人工智能”,要实现“强人工智能”还需要干预和反事实推理。因果推断对于克服现有人工智能在抽象、推理、可解释性等方面的不足具有重要意义。
因果推断框架的一个最基本的思想是:因果推断是关于世界的一个更加稳定的抽象模型。因果发现方法基于高阶信息推断因果结构,因果性学习从复杂信息中抽取因果结构,这两种方法也都是借鉴了这个思想。但由于受限于很多假设和理论基础,很多问题仍在研究过程中,有待大家进一步探索和解决。