
# 9장 통계적 추정

## 1. 통계적 추정의 기본개념

- 점추정(point estimation) : 모집단의 특성을 하나의 값으로 추정
- 구간추정(interval estimation) : 적절한 구간을 가지고 모수를 추정

## 2. 점추정과 추정량

### 점추정

- 추정값(estimate) : 모수를 추정한 값
- 추정량(estimator) : 추정값을 구하기 위하여 사용되는 추정방법 또는 추정값 계산을 위한 통계량

### 추정량의 결정 기준

- 불편성
    
    : 편의(bias)를 가지지 않는 = 0의 편의 = 불편추정량(unbiased estimator)
    
    - $E(\hat{\theta})$ = $\theta$  where $E(\bar{X}) = \mu$ and $E(S^2) = \sigma^2$
        - $\hat{\theta}$ = 추정량, $\theta$ = 모수
- 효율성
    
    : 추정량 중에서 **최소의 분산**을 가진 추정량이 가장 효율적
    
    - If Var$(\hat{\theta_1}$) < Var$(\hat{\theta_2})$, 추정량 $\hat{\theta_1}$이 상대적으로 효율적이다.
- 일치성
    
     : 표본의 크기 $n$이 무한히 증가하면, 그 표본에서 얻은 추정량 $\hat{\theta}$이 모수 $\theta$에 가까워 지는 것
    
    - $\displaystyle \lim_{n \to \infty}P(|\hat{\theta} - {\theta} | < \varepsilon) =1$ : 임의의 양수보다 작을 가능성이 1이다
- 충분성
    
    : 추정량이 모수에 대해서 가장 많은 정보를 제공할 때 그 추정량은 충분성이 있다고 봄
    

## 3. 구간추정

### 구간추정의 기본개념

- 구간추정은 모수가 존재할 범위를 제공함으로써 연구자가 원하는 만큼의 정확도를 가지고 모수를 추정할 수 있다는 장점을 가지고 있음

### 모집단 평균의 구간추정

- $\sigma$를 알고 있는 경우
    - $Z_\alpha$값은 좌우 대칭이라서 $\pm Z_{\alpha/2}$
    - $Z$값에 대한 신뢰구간
        - $P(-Z_{\alpha/2}\leq Z \leq Z_{\alpha/2}) = 1 - \alpha$
    - $\mu$에 대한 신뢰구간
        - $P(\bar{X}-Z_{\alpha/2} \cdot \sigma_{\bar{X}} \leq Z \leq \bar{X} + Z_{\alpha/2} \cdot \sigma_{\bar{X}}) = 1 - \alpha$
- $\sigma$를 모르는 경우
    - 표본에서 구한 불편추정량 $S$를 사용
    - t-통계량 = t분포를 이용하여 신뢰구간을 구함
        - $t = \frac{\bar{X}-\mu_{\bar{X}}}{S_{\bar{X}}}$
    - t-분포 : Z-분포와 유사함. 종 모양으로 t=0에 대해 대칭을 이룸
        - t-곡선의 모양 결정 = 자유도 $df$(자료집단의 관찰 값 중 자유롭게 선택될 수 있는 관찰 값의 수 = 즉 10개의 관찰 값이 있다면 자유도는 9)
        - 표분정규분포보다 두터운 꼬리를 갖고 있기 때문에 추정상의 오류를 보상해 줌
        - $t$-분포에서의 신뢰구간 추정
            - $P(\bar{X}-t_{\alpha/2} \cdot S_{\bar{X}} \leq \mu \leq \bar{X} + t_{\alpha/2} \cdot S_{\bar{X}}) = 1 - \alpha$
- 표본이 큰 경우의 신뢰구간
    - 표본의 크기가 큰 경우(30 이상), t-분포 대신 Z-분포를 사용해도 무방

### 모집단 비율의 구간 추정

- n이 크다면 표본비율 $p$에 해당하는 Z값은 아래와 같이 계산
- p에 해당하는 Z값($\sigma_{p}$를 아는 경우)
    - $Z = \frac{p-\pi}{\sigma_{p}}$
- p에 해당하는 Z값($\sigma_{p}$를 모르는 경우)
    - $Z = \frac{p-\pi}{S_{p}}$
- 모집단 비율 $\pi$의 신뢰구간
    - $p -Z_{\alpha/2} \cdot S_{p} \leq \pi \leq p + Z_{\alpha/2} \cdot S_{p}$

## 4. 표본크기의 결정

: 신뢰구간을 추정할 때 신뢰구간이 너무 넓으면 추정 결과가 무의미 

   → 신뢰구간의 폭을 결정하는 것은 신뢰도와 표본 크기의 두 가지 요인

### 모집단 평균을 추정할 때 표본크기의 결정

- 모집단의 평균 $\mu$ 표본 크기의 결정
    - $\bar{X} \leq Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$
        - 
    - $\bar{X} \leq t_{\alpha/2} \cdot \frac{S}{\sqrt{n}}$표
    
    : 오차의 범위를 나타낸 것 = 오차 $e$표
    
- 표본크기의 결정
    - $\sigma^2$를 알 때     $n = \frac{Z_{\alpha/2}^2 \cdot \sigma^2}{e^2}$
    - $\sigma^2$를 모를 때 $n = \frac{t_{\alpha/2}^2 \cdot S^2}{e^2}$표
- 표본크기와 요인
    - 신뢰 구간 : 오차의 크기와 표준편차 정해졌을 때, 신뢰구간을 크게할 수록 표본의 크기 크게
    - 표준편차 : 오차의 크기와 표준편차 정해졌을 때, 표준편차 또는 분산 클수록 표본 크기 크게
    - 오차의 크기 : 신뢰구간과 표준편차가 정해졌을 때, 오차를 작기 원하면 표본의 크기 크게

### 모집단 비율을 추정할 때 표본크기의 결정

- 신뢰구간과 오차가 주어졌을 때의 표본의 크기
    - $n = \frac{Z^2}{4e^2}$