### 신뢰구간 계산하기

In [1]:
import numpy as np
import scipy.stats as st

In [2]:
x = np.array([25,24,24,27,29,31,28,24,25,26,25,18,30,28,23,26,27,23,16,20,22,22,25,24, 24,25,25,27,26,30,25,25,26,26,25,24])
n = len(x)

In [3]:
# ddof = 1 표본분산, 표본표준편차.
n
x_mean = x.mean()
SEM = x.std(ddof=1)/np.sqrt(n*1.0)       #  st.sem(x) 로 대체 가능!

#### 90% 신뢰구간

In [4]:
# 알파 정의.
alpha = 0.1

In [5]:
# 근사값 사용.
(x_mean - 1.645*SEM, x_mean + 1.645*SEM)

(24.165832750582954, 25.834167249417046)

In [6]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM)

(24.1659069752658, 25.8340930247342)

In [7]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(1-alpha, loc = x_mean, scale = SEM )

(24.1659069752658, 25.8340930247342)

In [8]:
# 정확한 Student t 분포의 분위수 사용.
(x_mean - st.t.ppf(1-alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(24.14323039111625, 25.85676960888375)

In [9]:
# 패키지의 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(24.14323039111625, 25.85676960888375)

#### 95% 신뢰구간

In [10]:
# 알파 정의.
alpha = 0.05

In [11]:
# 근사값 사용.
(x_mean - 1.96*SEM, x_mean + 1.96*SEM)

(24.006098596439266, 25.993901403560734)

In [12]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM)

(24.006116859610792, 25.993883140389208)

In [13]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(1-alpha, loc = x_mean, scale = SEM )

(24.006116859610792, 25.993883140389208)

In [14]:
# 정확한 Student t 분포의 분위수 사용.
(x_mean - st.t.ppf(1-alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(23.97054738812868, 26.02945261187132)

In [15]:
# 패키지의 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(23.97054738812868, 26.02945261187132)

#### 99% 신뢰구간

In [16]:
# 알파 정의.
alpha = 0.01

In [17]:
# 근사값 사용.
(x_mean - 2.576*SEM, x_mean + 2.576*SEM)

(23.693729583891603, 26.306270416108397)

In [18]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM)

(23.69381614279075, 26.30618385720925)

In [19]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(1-alpha, loc = x_mean, scale = SEM )

(23.69381614279075, 26.30618385720925)

In [20]:
# 정확한 Student t 분포의 분위수 사용.
(x_mean - st.t.ppf(1-alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(23.618778470336505, 26.381221529663495)

In [21]:
# 패키지의 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(23.618778470336505, 26.381221529663495)