### 모평균의 구간추정

In [1]:
import numpy as np
import scipy.stats as st

In [2]:
# 주의: 표본은 단 1개!
x = np.array([25,24,24,27,29,31,28,24,25,26,25,18,30,28,23,26,27,23,16,20,22,22,25,24,24,25,25,27,26,30,25,25,26,26,25,24])
n = len(x)
print(n)            # 표본의 크기 출력.

36


#### 1. 표준오차 SEM = $ s \over{\sqrt{n}} $을 계산해 둔다.

In [3]:
# ddof = 1 표본분산, 표본표준편차를 계산할 때 불편 추정량을 사용한다.
# SEM = Standard Error of the Mean (평균의 표준오차).
x_mean = x.mean()                    # 표본의 평균을 계산해 둔다.
SEM = x.std(ddof=1)/np.sqrt(n)       # st.sem(x) 로 대체 가능!

#### 2. 90% 신뢰구간.

In [4]:
# 알파 (오차율) 설정.
alpha = 0.1

In [5]:
# Student t 분포의 분위수 사용.
(x_mean + st.t.ppf(alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(24.14323039111625, 25.85676960888375)

In [6]:
# Scipy 전용 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df=n-1, loc = x_mean, scale = SEM )

(24.14323039111625, 25.85676960888375)

#### 3. 95% 신뢰구간.

In [7]:
# 알파 (오차율) 설정.
alpha = 0.05

In [8]:
# Student t 분포의 분위수 사용.
(x_mean + st.t.ppf(alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(23.970547388128676, 26.02945261187132)

In [9]:
# Scipy 전용 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(23.97054738812868, 26.02945261187132)

#### 4. 99% 신뢰구간.

In [10]:
# 알파 (오차율) 설정.
alpha = 0.01

In [11]:
# Student t 분포의 분위수 사용.
(x_mean + st.t.ppf(alpha/2,df=n-1)*SEM, x_mean + st.t.ppf(1-alpha/2,df=n-1)*SEM)

(23.6187784703365, 26.381221529663495)

In [12]:
# Scipy 전용 함수 사용, Student t 분포의 신뢰구간.
st.t.interval(1-alpha, df = n-1, loc = x_mean, scale = SEM )

(23.618778470336505, 26.381221529663495)