<a href="https://colab.research.google.com/github/YeonJun-IN/probability_for_machine_learning/blob/main/Binomial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Binomial Distribution
## 1. Definition
- 확률 변수 X가 n개의 i.i.d $Bern(p)$ 시행에서 success가 발생한 횟수를 나타내면, X는 Binomial Distribution을 따른다.

- $X \sim Bin(n, p)$


## 2. PMF
> $P(X=k) = {n \choose k}p^{k} (1-p)^{n-k} = {n \choose k}p^{k} q^{n-k}$

- n번 i.i.d $Bern(p)$ 시행을 했을 때, k번 성공할 확률.
- e.g. 
  - 7번 시행을 했을 때 결과 값이 1 1 0 0 0 1 0 가 나왔다면, 확률 값은 ${7 \choose 3} p^3 q^4$가 됨.
  - 앞면이 나올 확률이 1/2 인 $Bern(1/2)$ 를 7번 독립적으로 시행했을 때, 앞면이 나오는 횟수에 대한 분포는 $Bin(7, 1/2)$를 따른다.

## 3. Expectation and Variance
#### Expectation
> $E(X) = \sum_{k=0}^{n}{k P(X=k)}$
>
> $= \sum_{k=0}^{n}{k {n \choose k}p^k q^{n-k}}$
> $= \sum_{k=1}^{n}{k {n \choose k}p^k q^{n-k}}$
>
> $= \sum_{k=1}^{n}{n{n-1 \choose k-1}p^k q^{n-k}}$
> 
> $= np\sum_{k=1}^{n}{{n-1 \choose k-1}p^{k-1} q^{n-k}}$
> 
> $= np\sum_{j=0}^{n-1}{{n-1 \choose j}p^{j} q^{n-j-1}}$
>
> $= np\sum_{j=0}^{n-1}{P(Y=j)}, \space\space where \space\space Y \sim Bin(n-1, p)$
> 
> $ = np$

#### Variance

> $X = I_1 + I_2+...+I_n,\space\space I_j \sim \space\space i.i.d \space\space Bern(p)$
>
> i.i.d 이기 때문에 $Cov(I_j, I_i)=0$이 되어서 $Var(X) = Var(I_1)+Var(I_2)+...+Var(I_n)$
>
> $Var(I_1) = p(1-p)$ 이기 때문에, $Var(X) = np(1-p)$

In [None]:
import numpy as np
import matplotlib.pyplot as plt

def Bern_rv(p): return 1 if np.random.uniform(0,1) >= p else 0

def Bin_rv(n,p):
  n_trial = []
  for _ in range(n):
    n_trial.append(Bern(p))
  _, counts = np.unique(result, return_counts=True)
  return counts[1]


In [None]:
Bin(100, p)

56

## 4. Binomial Distribution을 이해하는 다른 방법
1. Indicator random variable 이용
  - 확률변수 $X$는 n번의 시행 중 성공 횟수를 나타낸다. 그러므로 확률변수 $X$는 성공, 실패 여부를 결과로 나타내는 독립적인 n개의 indicator random variables의 합으로 나타낼 수 있다. 
  - $X = X_1 + X_2 + ... + X_n$
  
  - $X_j$는 성공(1), 실패(0) 의 두가지 결과 값만을 가진다. 그리고 성공 확률은 $p$, 실패 확률은 $1-p$ 이다. 이는 $Bern(p)$와 같다.
  - indicator r.v.s $
\begin{equation}
    X_j=
    \begin{cases}
      1, & \text{if}\ jth \space \space trial \space \space success \\
      0, & \text{otherwise}
    \end{cases}
\end{equation}
$
  - $X_j \sim i.i.d \space Bern(p)$


## 5. Binomial Distribution의 성질
> $X \sim Bin(n,p), \space \space Y \sim Bin(m,p)$, and $X$ independent of $Y$
> 
> then, $X+Y \sim Bin(n+m, p)$

- 개념적 접근
> $X$는 iid $Bern(p)$ n번 시행에서 성공 횟수
> 
> $Y$는 iid $Bern(p)$ m번 시행에서 성공 횟수
> 
> $X$와 $Y$는 독립이므로, $X$에서의 각 시행들과 $Y$에서의 각 시행들도 서로 독립.
> 
> 그렇다면 $X+Y$는 iid $Bern(p)$ 를 n번 시행 한 후에, 이어서 m번 추가적으로 했을 때, 전체 시행(m+n)에서의 성공 횟수라고 할 수 있음. => $X+Y \sim Bin(n+m, p)$
- Indicator r.v.s 이용
> indicator r.v.s $X_j, Y_i$를 이용하여 $X, Y$를 다음과 같이 나타낼 수 있음.
    - $X=X_1+X_2+...+X_n, \space \space Y=Y_1+Y_2+...+Y_m$ 
> 
> $X, Y$를 합하면 다음과 같음
> 
>   - $X+Y = X_1+X_2+...+X_n + Y_1+Y_2+...+Y_m$
> 
> $X_j, Y_i$는 i.i.d $Bern(p)$를 따르기 때문에, 결과적으로 $X+Y \sim Bin(n+m, p)$

- PMF
> $P(X+Y=k)$
> 
> $= \sum_{j=0}^{k} P(X+Y=k | X=j)P(X=j) \space \space \because Law \space \space of \space \space total \space \space probability$
> 
> $= \sum_{j=0}^{k} P(Y=k-j)P(X=j) \space \space \because X \space \space indep. \space \space of \space \space Y$ 
>
> $= \sum_{j=0}^{k} {m \choose k-j}p^{k-j} q^{m-k+j}{n \choose j}p^j q^{n-j}$
> 
> $= p^{k} q^{m+n-k}\sum_{j=0}^{k} {m \choose k-j}{n \choose j}$
> 
> $= p^{k} q^{m+n-k}{m+n \choose k} \space \space \because vandermonde's \space \space identity $

## 6. MLE of Binomial