### 베르누이 분포

$X \sim B(1,p)$

- $f(x) = p^x(1-p)^{1-x}, x = 0,1, 0\leq p\leq 1$
- $E(X)=p$
- $Var(X)=p(1-p)$

In [2]:
#베르누이 분포 
p = 0.3 # 성공할 확률
q = 1-p # 실패할 확률
E = p # 기대값
V = p * q #분산
print(f"해당 분포의 기대값은 {E}, 분산은 {V}")
from scipy.stats import bernoulli
E2, V2 = bernoulli.stats(p)
print(f"라이브러리- 해당 분포의 기대값은 {E2}, 분산은 {V2}")


해당 분포의 기대값은 0.3, 분산은 0.21
라이브러리- 해당 분포의 기대값은 0.3, 분산은 0.21


### 이항분포

$X \sim B(n,p)$
- $f(x) = {}_{n}C_x p^x(1-p)^{n-x}, x=0,1, ...,n$
- $E(X) = np$
- $Var(X) = np(1-p)$

${}_{n}C_r = \frac{n!}{(n-r)!r!}$

In [22]:
# 이항분포 
from scipy.stats import binom
import numpy as np
import math

def combi(a,b): # combination 함수 정의
    result= math.comb(a, b)  # Python 3.8 이상에서 사용 가능
    return result
# 근로자가 내년에 회사를 떠날 확률이 0.1이라고 추정한 경우, 
# 근로자 3명을 무작위로 뽑은 상황
n = 3 #근로자 샘플 개수
p = 0.1 # 떠날 확률

# 근로자가 떠날 확률에 대해 기대값과 분산 계산하기
E = n * p
V = n * p*(1-p)
print(f"해당 분포의 기대값은 {E:0.3f}, 분산은 {V:0.3f}")
E2,V2 = binom.stats(n,p)
print(f"라이브러리- 해당 분포의 기대값은 {E2:0.3f}, 분산은 {V2:0.3f}")


해당 분포의 기대값은 0.300, 분산은 0.270
라이브러리- 해당 분포의 기대값은 0.300, 분산은 0.270


In [27]:
# 확률 질량 함수 계산 
# 문제 : 1명이 금년에 회사를 떠날 확률은?
x = 1 # 떠날 샘플 개수 **확률변수 X
pmf = combi(n,x) * (p**x) * ((1-p)**(n-x))
print(f"해당 분포의 확률질량함수(pmf) : {pmf:0.3f}")
print(f"라이브러리 - 해당 분포의 확률질량함수(pmf) : {binom.pmf(x,n,p)} ")

해당 분포의 확률질량함수(pmf) : 0.243
라이브러리 - 해당 분포의 확률질량함수(pmf) : 0.243 


In [28]:
# 누적확률질량함수 계산 
# 문제 : 1명 이하로 떠날 확률은?
cdf = 0
for i in range(0,x+1): # 확률변수의 확률값들을 합함 # 0명 떠날 확률 +1명 떠날 확률
    cdf += binom.pmf(i,n,p)
print(f"해당 분포의 누적확률질량함수(cdf) : {cdf}")
print(f"라이브러리 - 해당 분포의 누적확률질량함수(cdf) : {binom.cdf(x,n,p)}")

해당 분포의 누적확률질량함수(cdf) : 0.972
라이브러리 - 해당 분포의 누적확률질량함수(cdf) : 0.972


In [30]:
# 이항분포의 정규분포 근사
from scipy.stats import norm
x,n,p = 10, 30, 0.5
b_result = binom.pmf(x,n,p)
E = n*p
sigma = np.sqrt(E*(1-p))
zstat1 = (x-0.5-E)/sigma # 이항분포의 x에서 -0.5
zstat2 = (x+0.5-E)/sigma # 이항분포의 x에서 +0.5
n_result = norm.cdf(zstat2) - norm.cdf(zstat1)

print(f"이항분포로 계산하면 {b_result:0.5f}이고 정규분포로 근사계산하면 {n_result:0.5f}")

이항분포로 계산하면 0.02798이고 정규분포로 근사계산하면 0.02787


### 음이항분포 

$X \sim NB(k,p)$

1) 확률변수 X = 시행횟수  
- $f(x) = {}_{x-1}C_{k-1}p^k(1-p)^{x-k}, x=k, k+1, ..., k>0$
- $E(X) = k/p$
- $Var(x) = k(1-p)/p^2$
2) 확률변수 X = 실패횟수
- $f(x) = {}_{x+l-1}C_(k-1)p^k(1-p)^x, x=,0,1,2,..., k>0$
- $E(X) = k(1-p)/p$
- $Var(X) = k(1-p)/p^2$

In [None]:
# 음이항분포 
# A가 승리할 확률이 0.3일 때, 5번 경기를 치르는 상황
from scipy.stats 

In [None]:
## 7 ##

In [77]:
1 - binom.cdf(3,6,0.5)

0.34375

In [78]:
0.34375 * 5

1.71875