#### 통계적 추정
- 점추정
  - 모평균이나 모분산 등의 모수를 하나의 수치로 추정
  - 추정량의 기댓값이 추측하려는 모수가 되는 성질을 불편성이라고 하며, 불편성을 가진 추정량을 불편추정량이라고 한다.
  - 표본평균이 모평균을 잘 추정할 수 있는 근거중 하나가 바로 이 불편성이다.
  - 표본크기 n을 증가시키면 추측하기 원하는 모수에 수렴해 가는 성질을 일치성이라고 하며, 일치성을 지닌 추정량을 일치 추정량이라고 함
  - 표본평균은 불편성과 일치성을 모두 가지고 있기 때문에 모평균을 잘 추정한다고 할 수 있다.
  - 모분산의 불편 추정량이 되는 표본통계량은 불편분산이다.
  - 불편분산은 표본분산에서 나누는 수 n-1로 하는 식으로 계산하며 표본분산은 $S^2$로 나타내지만 불편분산은 $s^2$으로 나타낸다.
  
- 구간추정
  - 모분산을 알고 있는 경우의 모평균 구간추정
  - 모분산을 알고 있는 경우의 모분산 구간추정
  - 모분산을 알지 못하는 경우 모평균 구간추정
  - 베르누이 분포의 모평균의 구간추정
  - 포아송 분포의 모평균의 구간추정

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats


In [20]:
np.random.seed(0)
sample = np.random.randint(1,20,10)
sample

array([13, 16,  1,  4,  4,  8, 10, 19,  5,  7])

In [None]:
# [과제] 모평균과 모분산의 점추정 사례를 파이썬 코드로 수행하세요.

In [22]:
for i in range(5):
    s_mean = np.mean(sample[i])
    print(f'{i+1}번째 표준평균:{s_mean:3f}')

1번째 표준평균:13.000000
2번째 표준평균:16.000000
3번째 표준평균:1.000000
4번째 표준평균:4.000000
5번째 표준평균:4.000000


In [24]:
sample_means = np.mean(sample)
np.mean(sample_means)

8.7

In [31]:
np.mean(np.random.choice(19,int(1e6)))

8.990957

In [39]:
np.random.seed(0)
sample1 = np.random.randint(1,101,20)
sample1

array([45, 48, 65, 68, 68, 10, 84, 22, 37, 88, 71, 89, 89, 13, 59, 66, 40,
       88, 47, 89])

In [44]:
for i in range(5):
    s_var = np.var(sample1[i])
    print(f'{i+1}번째 표본분산: {s_var:.3f}')

1번째 표본분산: 0.000
2번째 표본분산: 0.000
3번째 표본분산: 0.000
4번째 표본분산: 0.000
5번째 표본분산: 0.000


In [43]:
sample1_vars = np.var(sample1)
np.mean(sample1_vars)

629.41

In [45]:
s_mean = np.mean(sample1)
s_mean

59.3

In [None]:
# [과제] 모분산을 알지 못할 때 정규분포의 모평균의 구간 추정을 파이썬 코드로 수행하세요.

In [50]:
rv = stats.chi2(df=n-1)
cnt = 0
for sample in sample1:
    u_var = np.var(sample1, ddof=1)
    lcl = (n-1)*u_var/rv.isf(0.025)
    ucl = (n-1)*u_var/rv.isf(0.975)


In [51]:
rv = stats.t(df=n-1)
lcl = s_mean - rv.isf(0.025) * np.sqrt(u_var/n)
ucl = s_mean - rv.isf(0.975) * np.sqrt(u_var/n)

lcl,ucl

(40.88686273117575, 77.71313726882424)

In [None]:
# [과제] 모집단에 정규분포를 가정할 수 없는 예를 포아송 분포로 설정하여 모평균 신뢰구간을 구하세요

In [55]:
rv = stats.norm()
lcl = s_mean - rv.isf(0.025) * np.sqrt(u_var/n)
ucl = s_mean - rv.isf(0.975) * np.sqrt(u_var/n)

lcl,ucl

(43.346605389008594, 75.25339461099139)