# How to Design RCT for heterogeneity Effect
## Paper Summary
### Background

- Nudge experimentsが徐々に普及している

### RCTの実施にあたっての課題

- Cluster randomized, with a small # of clusters (< 50)
- simple design: 2-arm design (50/50 T/C) with business-as-usual control
- 統計的スキルを持っていない人によって実施
- Trial実施の前に、selectionが発生する（Don’thavecapacity etc）

### USでの教育実験の立地とDistrict sizeの分布

<img src = "https://github.com/RyoNakagami/omorikaizuka/blob/master/Econometrics/school_in_experiments.jpg?raw=true">

<img src = "https://github.com/RyoNakagami/omorikaizuka/blob/master/Econometrics/school_in_experiments_dist.jpg?raw=true">


### Sample ATE not equal Population ATE

- sampleとpopulationのmoderatorの分布が異なる場合、sample ATEとpopulation ATEは一致しない
- common supportが存在しないpopulation subsetに対してはATEは推定できない

#### Definition: moderator

1. (Temporal precedence): M(moderator) occurs before T(Treatment), which in turn occurs before O(Outcome).
2. (Correlation): M and T are uncorrelated.
3. (Statistical association): The effect size relating T on O changes depending on what M is.

### この章のMotivation

```
How can we design better trials so that results *do* generalize to policy-relevant populations?
```


### 実験時に明確に定義すべきこと

- A target population;
- Eligibility criteria for their study;
- Estimands of interest (and priorities);
- heterogeneous treatment effect;
- Resource constraints and recruitment strategies;
- Discussion of possible sources of treatment effect heterogeneity.
- external validity

### RCT実施の際に考慮すべきこと

- Data: target population dataで仮説を作る
- Knowledge: sampling method, estimator
- POC
- Money

### RCTのマイルストーン

1. sampleはpopulationのミニチュアとなっている
2. Sampling Ignorability

$$
E[Y(1) - Y(0)] \perp D|X
$$

### Stratificationのメリットとデメリット

|pros and cons|説明|
|---|---|
|メリット|ATEのvariance削減が期待できる <br> strata単位でのATEの差異を検出できる|
|デメリット|事前にtreatment effectのeffect sizeに影響を与えるcovariateがわからない <br> a large set of covariatesの時ほぼ不可能|

### stratification constraints

strataの数は以下の制約がかかる：

- sample sizeに限界がある
- 実験管理の工数がstratum単位で発生する
- strataの管理を適切に行うためには、実験計画及び進行の定式化が必要だが、そのフォーマット作成に時間がかかる

### stratumの個数の限界からどのようにstratumのグループを選択するか

- K-means clustering with Gower's distance

### Within-stratum recruiment

各stratumのsanmple sizeの定め方として、

- Proportional allocation
- Neyman allocation

### Moderatorのtest方法

- `The effect of a 1-unit change in X (one of moderator candiates) on the SD of Y.`を調べるのが一つの方法
- unit changeは単位に依存してしまうので正規化が必要になる

### cluster samplingとmoderatorのテスト

- moderatorのvariationが小さくなってしまい検出するのが難しくなる

### effect sizeと正規化

cluster randomized trialを考える

$$
Y_{ij} = \gamma_0 + \gamma_1 T_j = \gamma_2 X_j + \gamma_3 T_j * X_j + \gamma_j + e_{ij}
$$

where

- $i$: individual
- $j$: cluster unity
- $e_{ij} \sim N(0, \sigma^2)$
- $\gamma_j \sim N(0, \tau^2)$
- T: treatment status
- X: moderator

standard deviation unitで報告するときは

$$
\delta_m = \frac{\gamma_1}{\sqrt{\sigma^2 + \tau^2}}
$$

moderatorのeffect sizeを報告するときは

$$
\delta_{ds} = \gamma_3 \sqrt{\frac{\sigma^2_x}{\sigma^2 + \tau^2}}
$$

ただし、$\sigma^2_x$は離散変数か連続変数かで大きく値が異なってしまう問題がある（離散変数の方が大きめに出てしまう）。


### sample variation and the MDESD for moderators

MDESD = the minimum detectable effect size difference

$$
\text{MDESD}_p(|\delta_{ds}|) = M_v\sqrt{\frac{(1 - R^2_{|X})\rho n + (1- \rho)}{P(1-P)\sigma_x^2vn}}
$$

- $M_v = t_{\alpha/2} + t_{1-\beta}$
- with J sites, 𝑛 units within each site
- 𝜈 = J - K: degree of freedom
- $\rho = \tau^2/(\sigma^2 + \tau^2)$
- $R^2_{|X}= 1 - \tau^2_{|X}/\tau^2$
- $\sigma^2_X$: population x variance

ここでsampleのMDESDを定義すると

$$
\text{MDESD}(|\delta_{ds}|) = \text{MDESD}_p(|\delta_{ds}|)/\gamma_x
$$

where

$$
\gamma_x = S_x/\sigma_x
$$

よってpopulationとのstdの比率がheterogeneous effectの検出力のキーになっていることがわかる。


### Optimal design principles

- A-optimality: Minimize the average variance of the estimates of the regression coefficients
- D-optimality: Minimize $|(X’X)^{-1}|$ (which takes into account covariance)

この二つはtrade-off




[2, 3]