## 因果贝叶斯网络（Causal Bayesian Network）的干预公式

1 基本干预公式：$p(x_1,...,x_n|\hat x_i')=\prod_{j\neq i}p(x_j|pa_j)$

2 直接原因调整公式：$P(y|\hat x_i')=\sum_{pa_i}P(y|x_i',pa_i)P(pa_i)$

证明：

\begin{align}
P(x_1,...,x_n|\hat x_i')
&=\prod_{j\neq i}P(x_j|pa_j)\\
&=\frac {P(x_1,...,x_n)}{P(x_i'|pa_i)}\\
&=P(x_1,...,x_n|x_i',pa_i)P(pa_i)\\
\end{align}

设所有变量可简化为不相交的四组：$x_i,pa_i,y, w$，则：

\begin{align}
P(y|\hat x_i')
&=\sum_{w,pa_i,x_i}P(x_1,...,x_n|\hat x_i')\\
&=\sum_{w,pa_i}P(x_1,...,x_n|x_i',pa_i)P(pa_i)\\
&=\sum_{w,pa_i}P(x_i,pa_i,w,y|x_i',pa_i)P(pa_i)\\
&=\sum_{pa_i}P(x_i,pa_i,y|x_i',pa_i)P(pa_i)\\
&=\sum_{pa_i}P(y|x_i',pa_i)P(pa_i)
\end{align}

3 后门调整公式：$P(y|\hat x)=\sum_zP(y|x,z)P(z)$

其中变量组$Z$满足后门标准：
* $Z$中没有$X$的后代节点
* $Z$阻断了所有从$X$到$Y$且含有指向$X$箭头的路径

证明：由后门标准可得：
* ($X\perp\!\!\!\perp Z |T$)，其中$T$为$X$的直接原因组
* ($Y\perp\!\!\!\perp T |X, Z$)

由直接调整公式得：

$$P(y|\hat x)=\sum_{T}P(y|x,T)P(T)$$

所以：
\begin{align}
P(y|\hat x)
&=\sum_{T}P(y|x,T)P(T)\\
&=\sum_{T}P(T)\sum_Z P(y|x,T,Z)P(Z|x,T)\\
&=\sum_{T}P(T)\sum_Z P(y|x,Z)P(Z|T)\\
&=\sum_Z P(y|x,Z)\sum_{T}P(T)P(Z|T)\\
&=\sum_z P(y|x,z)P(z)
\end{align}

4 前门调整公式：$P(y|\hat x)=\sum_zP(z|x)\sum_{x'}P(y|x',z)P(x')$

其中变量组$Z$满足前门标准：
* $Z$阻断了所有从$X$到$Y$的直接路径
* 从$X$到$Z$没有未被阻断的后门路径
* 所有从$Z$到$Y$的后门路径都被$X$阻断


证明：由前门标准可得：
* ($Z\perp\!\!\!\perp U |X$)，其中$U$为$X$和$Y$之间的未被测量到的共因变量
* ($Y\perp\!\!\!\perp X |Z, U$)

\begin{align}
P(y|\hat x)
&=\sum_{z}\sum_{u}P(y,z,u|\hat x)\\
&=\sum_{z}\sum_{u}P(y|z,u)P(z|x)P(u)\\
&=\sum_{z}P(z|x)\sum_{u}P(y|z,u)P(u)\\
&=\sum_{z}P(z|x)\sum_{u}P(y|x,z,u)\sum_{x'}P(u|x')P(x')\\
&=\sum_{z}P(z|x)\sum_{u}P(y|x,z,u)\sum_{x'}P(u|x',z)P(x')\\
&=\sum_{z}P(z|x)\sum_{x'}P(x')\sum_{u}P(y|x',z,u)P(u|x',z)\\
&=\sum_{z}P(z|x)\sum_{x'}P(x')P(y|x',z)\\
\end{align}

5 干预运算规则

* 规则1（添加/删除观察条件）：$(Y\perp Z|X,W)_{G_\overline X}\Rightarrow P(y|\hat x,z,w)=P(y|\hat x,w)$
* 规则2（交换干预/观察条件）： $(Y\perp Z|X,W)_{G_{\overline X \underline Z}}\Rightarrow P(y|\hat x,\hat z,w)=P(y|\hat x,z,w)$
* 规则3（添加/删除干预条件）： $(Y\perp Z|X,W)_{G_{\bar X \overline {Z(W)}}}\Rightarrow P(y|\hat x,\hat z,w)=P(y|\hat x,w)$，其中 Z(W)为节点组Z的子集，且不能是W的祖先节点。

证明：

规则1：$(Y\perp Z|X,W)_{G_\overline X}\Rightarrow(Y\perp Z|X,W)_{G_\hat X}\Rightarrow (Y\perp Z|X,W)_{P_\hat X}$，即：

$$P(y|\hat x,z,w)=P(y|\hat x,w)$$

规则2：设T为Z的直接原因组成的集合，$(Y\perp Z|X,W)_{G_{\overline X \underline Z}}\Rightarrow(Y\perp T|X,W,Z)_{G_\overline X}\Rightarrow(Y\perp T|X,W,Z)_{G_\hat X}\Rightarrow(Y\perp T|X,W,Z)_{P_\hat X}$，即：

$$P(y|\hat x, z, w, T)=P(y|\hat x, z, w)$$

又由直接原因调整公式得：

$$P(y,w|\hat x,\hat z)=\sum_T P(y,w|\hat x,z',T)P(T)$$
$$P(w|\hat x,\hat z)=\sum_T P(w|\hat x,z',T)P(T)$$

所以：

\begin{align}
P(y|\hat x, \hat z, w)
&=\frac{P(y,w|\hat x,\hat z)}{P(w|\hat x,\hat z)}\\
&=\frac{\sum_T P(y,w|\hat x,z',T)P(T)}{\sum_T P(w|\hat x,z',T)P(T)}\\
&=\frac{\sum_T P(y|\hat x,z',T,w)P(w|\hat x, z',T)P(T)}{\sum_T P(w|\hat x,z',T)P(T)}\\
&=\frac{P(y|\hat x,z',w)\sum_T P(w|\hat x, z',T)P(T)}{\sum_T P(w|\hat x,z',T)P(T)}\\
&=P(y|\hat x,z',w)\\
\end{align}

规则3：因$X$与结论无关，为书写简化，以下证明先忽略掉$X$。

设$Z(W)=Z_1$，$Z-Z(W)=Z_2$，$T_1$为$Z_1$的直接原因组成的集合，$T_2$为$Z_2$的直接原因组成的集合。

$(Y\perp Z|W)_{G_{\overline {Z(W)}}}\Rightarrow(Y\perp Z_2,T_2|W)_{G_{\overline Z_1}}\Rightarrow(Y\perp Z_2,T_2|W)_{G_{\hat Z_1}}\Rightarrow(Y\perp Z_2,T_2|W)_{P_{\hat Z_1}}$，即：

$$P(y|\hat z_1, z_2, w, T_2)=P(y|\hat z_1, w)$$

又$W$不会是$Z_1$的后代节点，所以$(W\perp Z_1|T_1)_G\Rightarrow (W\perp Z_1|T_1)_P$，即：
$$P(w|z_1,T_1)=P(w|T_1)$$

又由$(Y\perp Z|W)_{G_{\overline {Z_1}}}$知，$Z_1$到$Y$的前门路径被阻断，而后门路径又被$T_1$阻断，所以$(Y\perp Z_1|W,T_1)_G\Rightarrow (Y\perp Z_1|W,T_1)_P$，即：
$$P(y|z_1,w,T_1)=P(y|w,T_1)$$

所以：

\begin{align}
P(y|\hat z_1, \hat z_2, w)
&=\frac{P(y,w|\hat z_1,\hat z_2)}{P(w|\hat z_1,\hat z_2)}\\
&=\frac{\sum_{T_2} P(y|\hat z_1,z_2',w,T_2)P(w|\hat z_1, z_2', T_2)P(T_2|\hat z_1)}{\sum_{T_2} P(w|\hat z_1, z_2', T_2)P(T_2|\hat z_1)}\\
&=\frac{P(y|\hat z_1,w)\sum_{T_2} P(w|\hat z_1, z_2', T_2)P(T_2|\hat z_1)}{\sum_{T_2} P(w|\hat z_1, z_2', T_2)P(T_2|\hat z_1)}\\
&=P(y|\hat z_1,w)\\
&=\frac{\sum_{T_1} P(y|z_1',w,T_1)P(w|z_1', T_1)P(T_1)}{\sum_{T_1} P(w|z_1', T_1)P(T_1)}\\
&=\frac{\sum_{T_1} P(y|w,T_1)P(w|T_1)P(T_1)}{\sum_{T_1} P(w|T_1)P(T_1)}\\
&=\frac{P(y,w)}{P(w)}\\
&=P(y|w)\\
\end{align}

所以：

$$P(y|\hat x, \hat z, w)=P(y|\hat x, w)$$

#### 参考资料

[1] Pearl, J. (2009). Causality. Cambridge: Cambridge University Press. doi:10.1017/CBO9780511803161