# 傾向スコア

## バランシングスコア

**バランシングスコア**（balancing score）$b(\boldsymbol{x})$とは、$b(\boldsymbol{x})$が条件付けられた下での共変量$\boldsymbol{x}$の分布が処置$z$と独立になる（処置群$(z=1)$と対照群$(z=0)$とで$x$の条件付き分布が等しくなる）ような関数である（[Rosenbaum & Rubin, 1983](https://academic.oup.com/biomet/article/70/1/41/240879)）。

$$
\newcommand{\b}[1]{\boldsymbol{#1}}
\newcommand{\indep}{\perp\!\!\!\perp}
\b{x} \indep z | b(\b{x})
$$

共変量$\boldsymbol{x}$自身は最も細かい（finest）バランシングスコアであり、傾向スコア$P(z=1|\boldsymbol{x})$は最も粗い（coarsest）バランシングスコアである。



## 傾向スコア

共変量$\b{x}_i$の下でその対象$i$が処置される確率

$$
e_i = P(z_i = 1| \b{x}_i)
$$

を**傾向スコア**（propensity score）という。


### 傾向スコアの使用方法

**1. マッチング**

傾向スコアの値が同じ（厳密マッチング）か近い（最近傍マッチング）個体を比較する

**2. 層別解析**

傾向スコアの値によっていくつかのサブクラスに分け、各クラスで処置群と対照群の平均をとって全体のATEを推定する

**3. 回帰分析・共分散分析**

割当変数$z$と傾向スコア$e$を説明変数とした線形の回帰分析を行う


**4. その他の推定量**

IPW推定量やDR推定量など（後述）


### 傾向スコアの長所

1. 共変量を1次元に次元削減しているため、2つの群において共変量の値に重なりが少ない場合でも使える
2. 共変量と結果変数のモデル設定を行わなくてもよい
    - 例えば回帰分析のような線形モデルを構築しなくてもよい → 共変量と結果変数の間に線形性を仮定できない場合でも使える可能性
3. モデルの誤設定に強い
    - 共分散分析やロジスティック回帰により$E[y|x]$を直接モデリングする方法と、層別による傾向スコア解析を比較したところ、傾向スコア解析のほうがモデルの誤設定から生じるバイアスがより少なかったという研究がある（Drake, 1993）


## IPW推定量

**逆確率重み付け**（inverse probability weighting: IPW）による推定量（Rubin, 1985）

$$
\begin{align}
\hat{E}(y_1) &= \sum^N_{i=1} \frac{z_i y_i}{e_i} / \sum^N_{i=1} \frac{z_i}{e_i}\\
\hat{E}(y_0) &= \sum^N_{i=1} \frac{(1-z_i) y_i}{1 - e_i} / \sum^N_{i=1} \frac{1 - z_i}{1 - e_i}\\
\end{align}
$$

**導出**

真の傾向スコアの値が既知で、「強く無視できる割り当て」条件が成立するなら、

$$
\begin{align}
E(y_1)
&= E_{\b{x}}[E(y_1|\b{x})]\\
&= E_{\b{x}}\left[ E\left( \frac{z}{e} |\b{x} \right) E(y_1|\b{x}) \right]
\hspace{1em} (おそらく真の傾向スコアなら z/e = 1 のため)
\\
&= E_{\b{x}}\left[ E\left( \frac{z}{e} y_1|\b{x} \right) \right]\\
&= E\left( \frac{z y_1 }{e} \right)\\
&= E\left( \frac{z^2 y_1 + z (1-z) y_0}{e} \right)
\hspace{1em} (\because z^2 = z,  z(1-z) = 0)
\\
&= E\left( \frac{zy}{e} \right)
\end{align}
$$

となり、$\hat{E}(y_1)$は$y_1$の周辺平均の不偏推定量になる。$\hat{E}(y_0)$も同様である。

真の傾向スコア$e$ではなく推定値$\hat{e}_i$を使ったとしても一致推定量となる。

$N$を大きくすると

$$
\frac{1}{N} \sum^N_{i=1} \frac{z_i}{e_i} \to 1, \hspace{1em}
\frac{1}{N} \sum^N_{i=1} \frac{1 - z_i}{1 - e_i} \to 1
$$

に確率収束することが大数の法則により成立する。

## DR推定量

### causallib

## 参考文献

- [計量経済学応用 傾向スコア](https://yukiyanai.github.io/jp/classes/econometrics2/contents/R/propensity-score.html)
- [cibook_ch3_pscore](https://gist.github.com/SakumaRyoDev/309c9c6c0002145d09fd36ddfbe3613b)
- [Rosenbaum, P. R., & Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. Biometrika, 70(1), 41-55.](https://academic.oup.com/biomet/article/70/1/41/240879)
- Rubin, D. B. (1985). The use of propensity scores in applied Bayesian inference. Bayesian statistics, 2, 463-472.