# Difference In Differences

**差の差法**（difference in differences: DID）



## 2群・2期間のDID

最もシンプルな2群・2期間のDIDを例にとる。

結果変数を$Y$、処置変数を$X \in \{0, 1\}$とする。
グループ$k$の時点$t$を$Y_{kt}$とすると、推定したい効果$\beta$だけでなくグループごとの固定効果$\alpha_k$と時間ごとの効果$\delta_t$も入ってくる。

$$
Y_{kt} = \beta X_{kt} + \alpha_k + \delta_t + \varepsilon_{kt}
$$


グループ$k=1$（処置群: $X_{10}=0, X_{11}=1$）

- 処置前（$t=0$）：$Y_{10} = \beta X_{10} + \alpha_1 + \delta_0 + \varepsilon_{10} = \alpha_1 + \delta_0 + \varepsilon_{10}$
- 処置後（$t=1$）：$Y_{11} = \beta X_{11} + \alpha_1 + \delta_1 + \varepsilon_{11} = \beta + \alpha_1 + \delta_1 + \varepsilon_{11}$

グループ$k=0$（対照群: $X_{00} = X_{01} = 0$）

- 処置前（$t=0$）：$Y_{00} = \beta X_{00} + \alpha_0 + \delta_0 + \varepsilon_{00} = \alpha_0 + \delta_0 + \varepsilon_{00}$
- 処置後（$t=1$）：$Y_{01} = \beta X_{01} + \alpha_0 + \delta_1 + \varepsilon_{01} = \alpha_0 + \delta_1 + \varepsilon_{01}$

個体固定効果$\alpha_k$を除去するため、グループごとに処置前後で差分をとると

$$
\begin{align}
Y_{11} - Y_{10}
    &= \beta + \alpha_1 + \delta_1 + \varepsilon_{11} - (\alpha_1 + \delta_0 + \varepsilon_{10})\\
    &=  \beta + \alpha_1 - \alpha_1 + \delta_1 - \delta_0 + \varepsilon_{11} - \varepsilon_{10}\\
    &=  \beta + \delta_1 - \delta_0 + \varepsilon_{11} - \varepsilon_{10}\\
\\
Y_{01} - Y_{00}
    &= \alpha_0 + \delta_1 + \varepsilon_{01} - (\alpha_0 + \delta_0 + \varepsilon_{00})\\
    &= \alpha_0 - \alpha_0 + \delta_1 - \delta_0 + \varepsilon_{01} - \varepsilon_{00}\\
    &= \delta_1 - \delta_0 + \varepsilon_{01} - \varepsilon_{00}\\
\end{align}
$$

となり、時間固定効果$\delta_t$を除去するために両者の差をとると

$$
\begin{align}
(Y_{11} - Y_{10}) - (Y_{01} - Y_{00})
&= \beta + \delta_1 - \delta_0 + \varepsilon_{11} - \varepsilon_{10} - (\delta_1 - \delta_0 + \varepsilon_{01} - \varepsilon_{00})\\
&= \beta + \delta_1 - \delta_0 - (\delta_1 - \delta_0) + \varepsilon_{11} - \varepsilon_{10} - (\varepsilon_{01} - \varepsilon_{00})\\
&= \beta + \varepsilon_{11} - \varepsilon_{10} - (\varepsilon_{01} - \varepsilon_{00})\\
&\approx \beta
\end{align}
$$

となる

## $2\times 2$差の差

2群2期間のDIDを例に取る

処置群$T$と対照群$U$が存在し、処置前を$\text{Pre}$、処置後を$\text{Post}$とする。DID推定量は各群の処置前後の$Y$の平均の差

$$
\def\pre{ \text{Pre} }
\def\post{ \text{Post} }
\hat{\delta}^{2\times 2}_{TU}
= \big( E[Y_T | \post] - E[Y_T | \pre] \big)
- \big( E[Y_U | \post] - E[Y_U | \pre] \big)
$$

である。潜在的結果で表記すると次のようになる。

$$
\hat{\delta}^{2\times 2}_{TU}
= \big( E[Y^1_T | \post] - E[Y^0_T | \pre] \big)
- \big( E[Y^0_U | \post] - E[Y^0_U | \pre] \big)
$$

ゼロを加えて整理すると

$$
\begin{align}
\hat{\delta}^{2\times 2}_{TU}
&= \big( E[Y^1_T | \post] - E[Y^0_T | \pre] \big)
- \big( E[Y^0_U | \post] - E[Y^0_U | \pre] \big)
+ \underbrace{ E[Y^0_T | \post] - E[Y^0_T | \post] }_{0}
\\
&= \underbrace{ E[Y^1_T | \post]  - E[Y^0_T | \post] }_{ATT}
+ \underbrace{ 
    \big[ E[Y^0_T | \post] - E[Y^0_T | \pre] \big]
    - \big[ E[Y^0_U | \post] - E[Y^0_U | \pre] \big]
}_{並行トレンドが成り立たない場合のバイアス}
\end{align}
$$

となり、並行トレンドの仮定が成り立てばDID推定量はATTを推定することになる。

ここで$E[Y^0_T|\post]$は実際には観測できない反実仮想であるため、並行トレンドの存在は検証不可能である。

## DIDの仮定

### 並行トレンドの仮定

時間固定効果がすべてのユニット（観測対象）で同じであり、期間の間で変化しないことを**並行トレンド**（parallel trends）の仮定と呼ぶ。




## Multiple

介入時点が複数ある時のための理論

以前は介入時点を0とするように指数化してまとめて扱うこともあったようだが、介入時点が異なるものは別個のグループとして扱って加重平均するほうがよいことがJournal of Econometricsの論文で示されたらしい

## Event study

## Synthetic Difference In Differences

[Clarke, D., Pailañir, D., Athey, S., & Imbens, G. (2023). Synthetic Difference In Differences Estimation. arXiv preprint arXiv:2301.11859.](https://arxiv.org/pdf/2301.11859.pdf)