# 隨機實驗與漸近性質

在因果推斷的隨機實驗設計中，樣本均值差估計量 $\hat{\tau}$ 不僅在有限樣本下是無偏的，  
而且在大樣本下具有良好的漸近性質。

---

## 樣本均值差的無偏性

估計量定義：

$$
\hat{\tau} = \bar{Y}_t - \bar{Y}_c,
$$

其中

$$
\bar{Y}_t = \frac{1}{n_t}\sum_{i:Z_i=1} Y_i, 
\quad 
\bar{Y}_c = \frac{1}{n_c}\sum_{i:Z_i=0} Y_i.
$$

由隨機分配的性質可得：

$$
\mathbb{E}[\hat{\tau}] = \tau = \mathbb{E}[Y_i(1) - Y_i(0)].
$$

---

## 一致性 (Consistency)

由大數法則 (Law of Large Numbers, LLN)，當 $n \to \infty$ 時：

$$
\bar{Y}_t \xrightarrow{p} \mathbb{E}[Y(1)], 
\quad
\bar{Y}_c \xrightarrow{p} \mathbb{E}[Y(0)].
$$

因此：

$$
\hat{\tau} \xrightarrow{p} \tau.
$$

這意味著樣本均值差估計量是一致的 (consistent)。

---

## 漸近常態分布 (Asymptotic Normality)

更進一步，由中心極限定理 (Central Limit Theorem, CLT)：

$$
\sqrt{n}(\hat{\tau} - \tau) \;\;\xrightarrow{d}\;\; 
\mathcal{N}(0, \, \sigma_t^2/p + \sigma_c^2/(1-p)),
$$

其中：
- $p = \lim_{n \to \infty} \frac{n_t}{n}$ 為處理組比例，  
- $\sigma_t^2 = \text{Var}[Y(1)]$,  
- $\sigma_c^2 = \text{Var}[Y(0)]$。  

這顯示出估計量在大樣本下服從常態分布，可用於信賴區間 (confidence intervals) 與假設檢定 (hypothesis testing)。

---

## R 語言模擬：漸近常態性



In [1]:
set.seed(123)

n <- 5000
Y0 <- rnorm(n, mean = 50, sd = 10)
Y1 <- Y0 + 5
Z <- rbinom(n, 1, 0.5)
Y <- Z*Y1 + (1-Z)*Y0

Y_t <- mean(Y[Z==1])
Y_c <- mean(Y[Z==0])
tau_hat <- Y_t - Y_c

# 樣本標準誤
se <- sqrt(var(Y[Z==1])/sum(Z==1) + var(Y[Z==0])/sum(Z==0))

cat("估計的 ATE =", tau_hat, "\n")
cat("95% 信賴區間 = [", tau_hat - 1.96*se, ",", tau_hat + 1.96*se, "]\n")

估計的 ATE = 5.308379 
95% 信賴區間 = [ 4.756899 , 5.859858 ]
