In [None]:
# 정리_확률분포와 확률변수
# https://zephyrus1111.tistory.com/274

In [1]:
## 1. 연속형 확률 변수
from scipy.stats import norm, uniform, t, f, chi2
 
## 1) 확률 분포 정의
## loc은 평균, scale은 표준편차, df는 자유도
norm_rv = norm(loc=0, scale=1) ## 평균이 0이고 표준편차가 1인 정규 분포
uniform_rv = uniform(loc=0, scale=1) ## [loc, loc+scale]에서의 유니폼 분포
t_rv = t(df=20) ## 자유도가 20인 t 분포
chi2_rv = chi2(df=30) ## 자유도가 30인 카이 제곱 분포
f_rv = f(dfn=20, dfd=30) ## 분자의 자유도 20, 분모의 자유도 30인 F 분포

In [3]:
## 2) 확률 밀도 함수 값 f(x) : pdf
norm_rv.pdf([0, 1.64, 1.96, 2.58]) 
uniform_rv.pdf([0, 0.5, 2]) ## 서포트 벗어난 값에 대해서는 0
t_rv.pdf([0, 2, 4]) 
chi2_rv.pdf([0, 2, 4])
f_rv.pdf([0, 2, 4])

array([0.        , 0.1100201 , 0.00069723])

In [10]:
## 3) 누적 분포값 : cdf
norm_rv.cdf([0, 1.64, 1.96, 2.58]) 
uniform_rv.cdf([0, 0.5, 2])
t_rv.cdf([0, 2, 4]) 
chi2_rv.cdf([0, 2, 4])
f_rv.cdf([0, 2, 4])

array([0.39894228, 0.39695255, 0.05730379])

In [15]:
## 4) 분위수 : ppf
norm_rv.ppf([0.025,0.05,0.95,0.975])
uniform_rv.ppf([0.025,0.05,0.95,0.975])
t_rv.ppf([0.025,0.05,0.95,0.975])
chi2_rv.ppf([0.025,0.05,0.95,0.975])
f_rv.ppf([0.025,0.05,0.95,0.975])

array([0.5       , 0.97036723, 0.99964824])

In [20]:
## 5) 크기가 10인 확률 변수 생성 : rvs
n = 10
norm_rv.rvs(size=n)
uniform_rv.rvs(size=n)
t_rv.rvs(size=n)
chi2_rv.rvs(size=n)
f_rv.rvs(size=n)

array([0.51112812, 0.86267888, 0.85791795, 0.77247169, 1.02909862,
       1.37820789, 0.86218671, 1.48077965, 0.70248621, 0.73635589])

In [3]:
## 2. 이산형 확률 변수
from scipy.stats import binom, bernoulli, randint
 
## 1) 확률 분포 정의
bernoulli_rv = bernoulli(p=0.3) ## 성공의 확률이 0.3인 베르누이 분포
binomial_rv = binom(p=0.5, n=20) ## 성공의 확률이 0.5, 시행횟수 20인 이항 분포
discrete_uniform_rv = randint(low=1, high=10) ## [1, 9]인 이산 유니폼 분포

In [26]:
## 2) 확률 질량 함수 값 : pmf
bernoulli_rv.pmf([0, 1, 2]) ## 0, 1 아닌 값은 0
binomial_rv.pmf([0, 9, 10, 11, 21]) ## 0, 1, ... , 20이 아닌 값은 0
discrete_uniform_rv.pmf([0, 5, 10]) ## 1, 2, ... ,9가 아닌 값은 0

array([0.        , 0.11111111, 0.        ])

In [4]:
## 3) 누적 분포 값 : cdf
bernoulli_rv.cdf([0, 1]) 
binomial_rv.cdf([0, 5, 20]) 
discrete_uniform_rv.cdf([0, 5, 9])

array([0.        , 0.55555556, 1.        ])

In [5]:
## 4) 분위수
bernoulli_rv.ppf([0.025,0.05,0.95,0.975])
binomial_rv.ppf([0.025,0.05,0.95,0.975])
discrete_uniform_rv.ppf([0.025,0.05,0.95,0.975])

array([1., 1., 9., 9.])

In [6]:
## 5) 크기가 10인 확률 변수 생성
size = 10
bernoulli_rv.rvs(size=size)
binomial_rv.rvs(size=size)
discrete_uniform_rv.rvs(size=size)

array([3, 4, 2, 1, 2, 1, 8, 7, 9, 7])