### 신뢰구간 계산하기

In [1]:
import numpy as np
import scipy.stats as st

In [3]:
x = np.array([25,24,24,27,29,31,28,24,25,26,25,18,30,28,23,26,27,23,16,20,22,22,25,24, 24,25,25,27,26,30,25,25,26,26,25,24])

n = len(x)
n

36

In [5]:
# ddof = 1 표본분산, 표본표준편차.
n
x_mean = x.mean()
# ddof: 불편추정량
s = x.std(ddof=1)
SEM = s/np.sqrt(n)       #  st.sem(x) 로 대체 가능!
SEM

0.50709255283711

#### 90% 신뢰구간

In [6]:
# 알파 정의.(오차율)
alpha = 0.1

In [9]:
# 근사값 사용.
# 왼쪽 오른쪽에서 0.05를 땐 것
# 신뢰구간의 하한과 상한
(x_mean - 1.645*SEM, x_mean + 1.645*SEM)

(24.165832750582954, 25.834167249417046)

- 미지의 모집단에 대한 추론(inference)

In [10]:
# 정확한 표준정규분포의 분위수 사용.
# 분위수
ppf = st.norm.ppf(1-alpha/2, loc=0, scale=1)
ppf

1.6448536269514722

In [11]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - ppf*SEM, x_mean + ppf*SEM)

(24.1659069752658, 25.8340930247342)

In [12]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(1-alpha, loc = x_mean, scale = SEM )

(24.1659069752658, 25.8340930247342)

- 라이브러리를 사용한 것과 식으로 계산한것이 같음

In [16]:
# 정확한 Student t 분포의 분위수 사용.
# 분위수
ppf = st.t.ppf(1-alpha/2, df=n-1)
ppf

1.6895724539637709

In [17]:
(x_mean - ppf*SEM, x_mean + ppf*SEM)

(24.14323039111625, 25.85676960888375)

In [19]:
# 패키지의 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(24.14323039111625, 25.85676960888375)

#### 95% 신뢰구간

In [20]:
# 알파 정의.
alpha = 0.05

In [21]:
# 근사값 사용.
(x_mean - 1.96*SEM, x_mean + 1.96*SEM)

(24.006098596439266, 25.993901403560734)

In [22]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM)

(24.006116859610792, 25.993883140389208)

In [23]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(1-alpha, loc = x_mean, scale = SEM )

(24.006116859610792, 25.993883140389208)

In [24]:
# 정확한 Student t 분포의 분위수 사용.
(x_mean - st.t.ppf(1-alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(23.970547388128676, 26.029452611871324)

In [25]:
# 패키지의 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(23.970547388128676, 26.029452611871324)

#### 99% 신뢰구간

In [26]:
# 알파 정의.
alpha = 0.01

In [27]:
# 근사값 사용.
(x_mean - 2.576*SEM, x_mean + 2.576*SEM)

(23.693729583891603, 26.306270416108397)

In [28]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(1-alpha/2,loc=0,scale=1)*SEM)

(23.69381614279075, 26.30618385720925)

In [29]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(1-alpha, loc = x_mean, scale = SEM )

(23.69381614279075, 26.30618385720925)

In [30]:
# 정확한 Student t 분포의 분위수 사용.
(x_mean - st.t.ppf(1-alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(23.618778470336505, 26.381221529663495)

In [31]:
# 패키지의 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(23.618778470336505, 26.381221529663495)