# 1. Graph terminology

* Node
* Edge
* Undirected Graph
* Directed Graph
* Adjacent
* (Directed) Path
* Ancestor / Descendant
* Cycle
* Directed Acyclic Graph

# 2. Bayesian networks and causal graphs

$$
P(x_1, x_2, \ldots, x_n) = P(x_1) \prod_i P(x_i \mid x_1, \ldots , x_{i-1})
$$

* $X_i$가 binary일 경우 각 팩터들을 모델링하기 위해선 $2^{n-1}$개의 parameter가 필요
* 전체를 모델링하는 것보다 local dependency를 모델링하는 것이 효율적임

## 2.1 Local Markov assumption

* node $X$의 부모가 conditional이면, $X$와 $X$의 자식이 아닌 변수들은 독립

<img src="3 - The Flow of Association and Causation in Graphs.assets/image-20220818115516117.png" alt="image-20220818115516117">

$$
\begin{aligned}
P(x_1, x_2, x_3, x_4) &= P(x_1)P(x_2 \mid x_1)P(x_3\mid x_1, x_2)P(x_4 \mid x_1, x_2, x_3)
\\
&= P(x_1) P(x_2 \mid x_1) P(x_3 \mid x_1, x_2) P(x_4 \mid x_1, x_2)
\end{aligned}
$$

### Bayesian network factorization

$$
P(x_1, x_2, \ldots, x_n) = \prod_i P(x_i \mid pa_i)
$$

* Local Markov assumption과 동치임

## 2.2 Minimality Assumption

* Edge가 있으면 dependent하다.
* 이는 Local markov assumption보다 좀 더 강한 가정
  * edge가 없으면 독립
  * 비독립이면 edge가 있음
* 무의미한 edge 표시의 최소화를 의미함
  * 무의미한 edge 제거는 확률분포의 Independence 정보를 최대한으로 표시하는 것

## 2.3 Causal edges assumption

* $Pa(X_i)$는 $X_i$의 direct cause이다.

* What is cause?
  * $X$ is a caused of $Y$ if $Y$ changes in response to changes in $X$

# 3. The basic building blocks of graphs

<img src="3 - The Flow of Association and Causation in Graphs.assets/image-20220818122459055.png" alt="image-20220818122459055">

* Chain, Fork
  * $X_1 \perp X_3 \mid X_2$
  * $X_1 \not\perp X_3 $
* Immorality (Collider)
  * $X_1 \perp X_3$
  * $X_1 \not\perp X_3 \mid X_2$
  * "외모가 뛰어난 사람은 성격이 별로야"
  * 외모가 뛰어났는데 성격도 좋으면 주변에 없기 마련

<img src="3 - The Flow of Association and Causation in Graphs.assets/image-20220818123914298.png" alt="image-20220818123914298">

# 4. The flow of association and causation

## 4.1 Blocked path definition

* $X$에서 $Y$로가는 path는 $Z$에 의해 block된다. if
  * path 사이에 $\leftarrow W (\in Z)\rightarrow$ 혹은 $\rightarrow W(\in Z) \rightarrow$ 가 있거나
  * path 사이에 $\rightarrow W (\notin Z) \leftarrow$ 가 있고 $de(W) \not \subset Z$

## 4.2 D-separation

* All of the paths $(X, Y)$ is blocked by a set $\mathbf Z \not\ni X, Y$
* $X \perp_G Y \mid \mathbf Z$

## 4.3 Global Markov assumption

* 만약 $P$가 $G$에 관해 local Markov assumption을 만족한다면,

* $X \perp_G Y \mid \mathbf Z$ 은 $X \perp_P Y \mid \mathbf Z$를 imply한다.

## Examples

<img src="3 - The Flow of Association and Causation in Graphs.assets/image-20220818144848631.png" alt="image-20220818144848631">

* $T \perp_G Y$   or   $T \not\perp_G Y$
* $T \perp_G Y \mid W_2$   or   $T \not\perp_G Y \mid W_2$
* $T \perp_G Y \mid W_2, M_1$   or   $T \not\perp_G Y \mid W_2, M_1$
* $T \perp_G Y \mid W_1, M_2$   or   $T \not\perp_G Y \mid W_1, M_2$
* $T \perp_G Y \mid W_1, M_2, X_2$   or   $T \not\perp_G Y \mid W_1, M_2, X_2$

<img src="3 - The Flow of Association and Causation in Graphs.assets/image-20220818145927814.png" alt="image-20220818145927814">

* $T \perp_G Y$   or   $T \not\perp_G Y$
* $T \perp_G Y \mid W$   or   $T \not\perp_G Y \mid W$
* $T \perp_G Y \mid W, X_2$   or   $T \not\perp_G Y \mid W, X_2$

## Chart

<img src="3 - The Flow of Association and Causation in Graphs.assets/image-20220818150219742.png" alt="image-20220818150219742">

1. D-separation이 독립을 의미
2. Edge의 존재는 통계적 dependency를 의미
3. Edge의 방향은 cause-effect를 의미