# 큰 수의 법칙 <a id="part1"></a>

우리 반 학생들은 한 달에 치킨을 몇 번 먹을까? 우리 반 학생들이 한 달에 치킨을 평균적으로 몇 번 먹는지 구하는 법은 간단하다. 우리 반 모든 학생들에게 모두 물어보고 평균을 구하면 된다. <br>
<b>하지만!</b> 만약에 전국 모든 학생들이 한 달동안 평균적으로 치킨을 몇 번 먹는지 구하고 싶으면 어떻게 해야할까? 전국의 모든 학생들에게 물어보는 방법은 현실적으로 불가능하다. <br>
<b> 표본평균과 모평균의 관계를 이용하자! </b>


### Q1. 표본의 개수가 많아질 때 표본평균은 모평균으로 수렴할까?

In [26]:
# 이항분포
# n은 표본의 개수
# p는 이항분포의 확률

from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
import numpy as np

@interact(n=(1,100,1), p=(0.0, 1.0, 0.1))
def f(n, p) :
  S = np.random.binomial(n, p)
  print(f"표본의 개수는 {n}개이며, 모평균은 {p} 표본평균은 {S/n}이다.")

interactive(children=(IntSlider(value=50, description='n', min=1), FloatSlider(value=0.5, description='p', max…

In [27]:
# 연속균등분포 0.0 ~ 1.0
# n은 표본의 개수

from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
import numpy as np

@interact(n=(1,100,1))
def f(n) :
  S = np.random.uniform(low=0.0, high=1.0, size = n)
  print(f"표본의 개수는 {n}개이며, 모평균은 0.5 표본평균은 {np.mean(S)}이다.")

interactive(children=(IntSlider(value=50, description='n', min=1), Output()), _dom_classes=('widget-interact',…

In [30]:
# 이항분포
# n은 표본의 개수
# p는 이항분포의 확률

from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
import numpy as np

@interact(n=(1,100,1), l=(0, 10, 1))
def f(n, l) :
  S = np.random.poisson(lam = l, size = n)
  print(f"표본의 개수는 {n}개이며, 모평균은 {l} 표본평균은 {np.sum(S)/n}이다.")

interactive(children=(IntSlider(value=50, description='n', min=1), IntSlider(value=5, description='l', max=10)…

## Strong Law of Large Numbers
$X_1, X_2, \cdots$ 가 *IID* 이고 $\mathbf{E}|X_i| < \infty$이며, $EX_i = \mu$ 일때
\begin{equation}
\frac{X_1 + X_2 + \cdots + X_n}{n} \to \mu ~ a.s.
\end{equation} 

그러므로 크기가 큰 표본의 평균을 이용해서 모평균을 추측할 수 있다!!

### Q2. 표본 평균의 분포는 어떤 특징을 가지고 있을까?
\begin{equation}
\frac{\sqrt{n}(\overline{X}_n - \mu)}{\sigma} 
\end{equation}
의 분포 탐구해보기

In [35]:
# 이항분포
# n은 표본의 개수
# p는 이항분포의 확률

from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
import numpy as np
import matplotlib.pyplot as plt

@interact(n=(100,1000,100), p=(0.0, 1.0, 0.1))
def f(n, p) :
  S = np.random.binomial(n, p, 1000)
  S = np.sqrt(n) * (S/n - p) / np.sqrt(p*(1-p))
  _, bins, _ = plt.hist(S, 100, density=True)
  plt.plot(bins, 1/( np.sqrt(2 * np.pi))*np.exp( - bins **2 / 2 ),
          linewidth=2, color='r', label="Z~N(0,1)")
  plt.legend()
  plt.title(f"Sample size is {n}")
  plt.show()

interactive(children=(IntSlider(value=500, description='n', max=1000, min=100, step=100), FloatSlider(value=0.…

# Central Limit Theorem 
Let $X_1, \cdots X_n$ be *IID* with mean $\mu$ and variance $\sigma^2$.<br>
Let $\overline{X}_n = \frac{\sum_{i=1}^n X_i}{n}$ . Then
\begin{equation}
Z_n = \frac{\overline{X_n} - \mu}{\sqrt{\mathbf{V}(\overline{X}_n)}} = \frac{\sqrt{n}(\overline{X}_n - \mu)}{\sigma} \rightarrow Z
\end{equation}
where $Z \sim N(0,1)$. <br>

중심극한 정리가 의미하는 것 : <br>
<b> 어떤 형태의 분포가 오더라도, 표본평균의 분포는 정규분포의 형태로 다가간다!! </b>