### 신뢰구간 계산하기

In [1]:
import numpy as np
import scipy.stats as st

In [2]:
x = np.array([25,24,24,27,29,31,28,24,25,26,25,18,30,28,23,26,27,23,16,20,22,22,25,24, 24,25,25,27,26,30,25,25,26,26,25,24])
n = len(x)

In [16]:
# ddof = 1 표본분산, 표본표준편차.
# n
# x_mean = x.mean()
# SEM = x.std(ddof=1)/np.sqrt(n*1.0)
n = 25
x_mean = 5500
SEM = x.std(ddof=1)/np.sqrt(n*1.0)

#### 90% 신뢰구간

In [17]:
# 근사값 사용.
(x_mean - 1.645*SEM, x_mean + 1.645*SEM)

(5498.998999300699, 5501.001000699301)

In [18]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(0.95,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(0.95,loc=0,scale=1)*SEM)

(5498.9990883703185, 5501.0009116296815)

In [19]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(0.9, loc = x_mean, scale = SEM )

(5498.9990883703185, 5501.0009116296815)

In [20]:
# 패키지의 함수 사용, Student=t 분포의 신뢰구간.
st.t.interval(0.9, df = n-1, loc = x_mean, scale = SEM )

(5498.958909326195, 5501.041090673805)

#### 95% 신뢰구간

In [21]:
# 근사값 사용.
(x_mean - 1.96*SEM, x_mean + 1.96*SEM)

(5498.807318315728, 5501.192681684272)

In [22]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(0.975,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(0.975,loc=0,scale=1)*SEM)

(5498.807340231533, 5501.192659768467)

In [23]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(0.95, loc = x_mean, scale = SEM )

(5498.807340231533, 5501.192659768467)

In [24]:
# 패키지의 함수 사용, Student=t 분포의 신뢰구간.
st.t.interval(0.95, df = n-1, loc = x_mean, scale = SEM )

(5498.744094891505, 5501.255905108495)

#### 99% 신뢰구간

In [12]:
# 근사값 사용.
(x_mean - 2.576*SEM, x_mean + 2.576*SEM)

(23.693729583891603, 26.306270416108397)

In [13]:
# 정확한 표준정규분포의 분위수 사용.
(x_mean - st.norm.ppf(0.995,loc=0,scale=1)*SEM, x_mean + st.norm.ppf(0.995,loc=0,scale=1)*SEM)

(23.69381614279075, 26.30618385720925)

In [14]:
# 패키지의 함수 사용, 표준정규분포의 신뢰구간.
st.norm.interval(0.99, loc = x_mean, scale = SEM )

(23.69381614279075, 26.30618385720925)

In [15]:
# 패키지의 함수 사용, Student=t 분포의 신뢰구간.
st.t.interval(0.99, df = n-1, loc = x_mean, scale = SEM )

(23.618778470336505, 26.381221529663495)