# 大數法則與中央極限定理

## 弱大數法則

```{admonition} 定義
隨機樣本 $X_1, X_2, ..., X_n \overset{i.i.d.}{\sim} f_X(x)$ ，滿足以下式子

$$
\bar{X} \overset{P}{\rightarrow} \mu \hspace{1em} as \hspace{1em} n \rightarrow \infty
$$

表示**樣本平均數機率收斂於母體期望值**，其中 $\bar{X}$ 為樣本平均數， $\mu$ 為母體期望值， $f_X(x)$ 為任意分配。也可以表示成

$$
\lim_{n \rightarrow \infty} \mathbb{P}(|\bar{X} - \mu| > \epsilon) = 0
$$

上面的式子表示：當樣本數 $n$ 趨近於無窮時，其**樣本平均數 $\bar{X}$ 跟母體期望值 $\mu$ 的差距**要大於一個很小的數 $\epsilon$ 的機率為0，代表`樣本平均數幾乎等於母體平均數`。
```

- 弱大數法則在講的是**樣本平均數**會機率收斂於**母體期望值**，所以**母體期望值**不存在的分配就不適用，如：柯西分配。

以指數分配為例，隨機樣本 $X_1, X_2, ..., X_n \overset{i.i.d.}{\sim} \mathcal{Exp}(\lambda)$ ，其母體期望值 $\mu = \frac{1}{\lambda}$ 。

我們會針對不同的 $n$ ，各模擬1000次的樣本平均數 $\bar{X}$ ，並得到**樣本平均數的抽樣分配**。

In [None]:
import numpy as np
import scipy.stats as stats
from plotly.subplots import make_subplots
import plotly.graph_objects as go

n_sample = 1000
lmbd = 5
ns = [[3, 10], [100, 10000]]

fig = make_subplots(
    rows=2,
    cols=2,
    shared_xaxes=True
)
mean = stats.expon.mean(scale=1 / lmbd)

for i, row in enumerate(ns, start=1):
    for j, col in enumerate(row, start=1):
        sample_means = []

        for _ in range(n_sample):
            sample_means.append(
                np.mean(stats.expon(scale=1 / lmbd).rvs(size=col)))

        hist = go.Histogram(x=sample_means, name=f'$n = {col}$')
        fig.add_trace(hist, row=i, col=j)
        fig.add_vline(x=mean, row=i, col=j)

fig.update_layout(title={'text': '指數分配的樣本平均數抽樣分配'})
fig


## 中央極限定理

