# 랜덤표본과 통계량

__랜덤표본(random sample)__
- 서로 독립이고 동일한 분포의 확률변수 $X_1,...,X_n$
- 모집단의 PDF $f(x)$에 대해 $f(x_1,..,x_n)=f(x_1)f(x_2)\cdots f(x_n)$
- 기호: $X_1,...,X_n \sim \text{iid} f(x)$
- 통계학 방법론의 기본 가정으로, 확률표본으로도 표현한다.
- 대표적인 자료의 형태이다.

__모수공간(parameter space)__
- 모수(parameter): 모형 설정에 사용되는 매개변수, 모집단의 분포를 결정한다.
- 모수공간: 가능한 모수 값의 전체 집합

__통계량(statistic)__
- 랜덤표본 $X=(X_1,...,X_n)$의 함수 $u(X)=u(X_1,...,X_n)$
- 랜덤표본의 값에 따라 값이 결정되는 함수이다.

__표본분포(sampling distribution)__
- _통계량의 분포_ 를 의미한다. 표본으로부터 통계량이 결정되기 때문이다.
- 표본분포는 모집단의 분포로 결정된다. 
- 통계량도 따라서 확률변수이다.

# 변수변환법

통계량의 확률분포(=표본분포)를 구하는 일반적인 방법이다.

확률변수의 수열 $X_1,...,X_n$ (일반적으로 iid를 가정한다.)

확률변수의 함수 $Y=u(X)=u(X_1,...,X_n)$
- $sum=X_1 + \cdots X_n,\ \bar{X}=(X_1 + \cdots + X_n)/n,\ S^2$ 등

$Y$의 분포를 유도하는 방법:
- 이산형: $P(Y=y)=\sum_{x:u(x)=y}P(X=x)$
- 연속형: $pdf_y(y)dy = \sum_{x:u(x)=y} pdf_x(x) dx$

통계량과 표본의 함수 관계를 이용하여 변수를 표본에서 통계량으로 바꾸는 방법

다른 방법: 누적분포함수법, 적률생성함수법 등

---

이항 확률변수의 가법성(서로 독립일 경우)
$$
X_1 \sim B(n_1,p),\quad X_2 \sim B(n_2,p) \\
Y=X_1 + X_2 \sim B(n_1 + n_2, p)
$$
- $P(Y=y)=\sum_{x_1+x_2=y}P(X_1=x_1, X_2=x_2)=\\
\binom{n_1 + n_2}{y}p^y (1-p)^{n_1 + n_2 - y}$ : 이항정리에 의해 가능
  
포아송 확률변수의 가법성(서로 독립일 경우)
$$
X_1 \sim Poi(\lambda_1),\quad X_2 \sim Poi(\lambda_2)\\
Y=X_1 + X_2 \sim Poi(\lambda_1 + \lambda_2)
$$
- $P(Y=y)=\sum_{x_1+x_2=y}P(X_1=x_1, X_2=x_2)=\\
e^{-\lambda_1 -\lambda_2}\frac{(\lambda_1+\lambda_2)^y}{y!}$ : 이것도 이항정리(교재 참고)

---

__누적분포함수 방법의 예:__

$$
X \sim N(0,1) \to Y=X^2 \sim Gamma(1/2, 2)
$$

- CDF: $G(y) = P(Y\le y)=P(-\sqrt{y} \le X \le \sqrt{y})
= 2 \sum_0^{\sqrt{y}} (2\pi)^{-1/2}\exp(-x^2/2)dx,\ y>0$
- PDF: $pdf_y(y)=G'(y)=2\cdot (2\pi)^{-1/2}e^{-y/2}\cdot (2\sqrt{y})^{-1}\\ =(\Gamma(1/2)2^{1/2})^{-1}y^{1/2-1}e^{-y/2},\ y>0\ (\pi^{1/2}=\Gamma(1/2))$

$$
Gamma(k/2, 2) = \chi^2(k)
$$

$Y \sim Gamma(1/2,2) \equiv \chi^2(1)$ 
- 표준정규분포 $N(0,1)$의 제곱은 자유도 1의 카이제곱분포이다.

표준정규분포를 따르는 확률변수를 $k$ 개 제곱해서 더하면 자유도가 $k$인 카이제곱분포를 따른다.

---

__확률변수의 일대일 함수의 pdf__
- 연속형 확률변수 $X=(X_1, ...,X_k)$
- $Y=(Y_1,...,Y_k)=u(X)=(u_1(X),...,u_k(X))$
- 벡터값 함수 $u=(u_1,...,u_k)$가 일대일 함수
    - $X$에서 $Y$로 가는 함수가 일대일 대응이어야 성립한다.
- 0이 아닌 야코비안 행렬식: $J_u(x)=\det(\partial u_j(x)/\partial x_i) \neq 0$
    - $k$ 차원 함수의 편도함수 행렬의 행렬식이 야코비안 행렬식이다.
    - $X=u^{-1}(Y)=(u^{-1}(Y),...,u^{-1}_k(y))$
    - $J_{u^{-1}}(y) = \det(\partial u^{-1}_j (y) / \partial y_i) \neq0$
    - $Y$의 pdf: $pdf_Y (y) = pdf_X (u^{-1}(y))\cdot |J_{u^{-1}}(y)|$

### Jacobian Matrix and its Determinant

The Jacobian matrix $ J_u(x) $ is defined as the matrix of partial derivatives of the transformation $ u(x) $ with respect to $ x $:

$$
J_u(x) = \begin{pmatrix}
\frac{\partial u_1}{\partial x_1} & \frac{\partial u_1}{\partial x_2} & \cdots & \frac{\partial u_1}{\partial x_n} \\
\frac{\partial u_2}{\partial x_1} & \frac{\partial u_2}{\partial x_2} & \cdots & \frac{\partial u_2}{\partial x_n} \\
\vdots & \vdots & \ddots & \vdots \\
\frac{\partial u_m}{\partial x_1} & \frac{\partial u_m}{\partial x_2} & \cdots & \frac{\partial u_m}{\partial x_n}
\end{pmatrix}
$$

The determinant of the Jacobian matrix is given by:

$$
\det(J_u(x)) = \det\left( \frac{\partial u_j(x)}{\partial x_i} \right)
$$

This determinant must be non-zero for the transformation to be valid:

$$
\det(J_u(x)) \neq 0
$$


1차원: $Y=u(X) \to X=u^{-1}(Y)$
- $pdf_Y(y)=pdf_X(u^{-1}(y))\cdot (u^{-1}(y))'$

---

__2차원: 변수변환의 핵심__
- $X=(X_1, X_2) \sim pdf\ f(x_1,x_2)$
- 새로운 확률변수: $Y_1=u_1(X_1,X_2),\ Y_2=u_2(X_1,X_2)$
- 일대일 대응이면: $X_1=w_1(Y_1,Y_2),\ X_2=w_2(Y_1,Y_2)$
- $(Y_1,Y_2) \sim pdf\ g(y_1,y_2)=f(w_1(y_1,y_2),w_2(y_1,y_2))\cdot |J|,$
    - where $J=\det \left[(\partial x_j/\partial y_i)_{i,j=1}^2 \right]$
- 영역은 __함수 또는 역함수 관계__ 에 따라 결정된다.
    - 위 식들이 성립하기 위해선 반드시 일대일 대응이어야 한다.

---

예 4.1.5 (p.146) 위치모수와 척도모수
- $Z \sim pdf\ f(z),\ X=\sigma Z + \mu \to f_X(x) = f((x-\mu)/\sigma)\cdot(1/\sigma)$
- $Z \sim N(0,1) \to X=\sigma Z + \mu \sim N(\mu, \sigma^2)$
- $Z \sim Exp(1) \to X=\sigma Z \sim Exp(\sigma)$
- $Z \sim Gamma(\alpha,1) \to X=\beta Z \sim Gamma(\alpha, \beta)$

---
### 예 4.1.6 (p.147) 베타분포

#### 1. 독립적인 감마분포 $ X_1 $과 $ X_2 $
- $ X_1 \sim \text{Gamma}(\alpha_1, \beta) $, $ X_2 \sim \text{Gamma}(\alpha_2, \beta) $이며, $ X_1 $과 $ X_2 $는 서로 독립입니다.
- 감마분포의 모수는 형태 모수(shape parameter) $ \alpha $와 척도 모수(scale parameter) $ \beta $로 주어집니다.

#### 2. 변수 변환
- 새로운 변수 $ Y_1 $과 $ Y_2 $를 다음과 같이 정의합니다:
  $$
  Y_1 = \frac{X_1}{X_1 + X_2}, \quad Y_2 = X_1 + X_2
  $$
- $ Y_1 $은 두 감마 분포에서 비율을 나타내는 변수이고, $ Y_2 $는 두 분포의 합입니다.

#### 3. 역변환
- $ X_1 $과 $ X_2 $를 $ Y_1 $과 $ Y_2 $로 표현한 식을 역변환하여 다음과 같이 나타낼 수 있습니다:
  $$
  X_1 = Y_1 Y_2, \quad X_2 = Y_2(1 - Y_1)
  $$
- 즉, 새로운 변수 $ Y_1 $과 $ Y_2 $를 통해 $ X_1 $과 $ X_2 $를 다시 정의합니다.

#### 4. 야코비안(Jacobian)
- 변수 변환에서 중요한 부분인 야코비안(Jacobian)을 계산해야 합니다. 야코비안은 다음과 같이 주어집니다:
  $$
  J = Y_2
  $$
  이는 변수 변환의 결과로 나오는 결정 행렬의 크기를 나타냅니다.

#### 5. 결합 확률밀도 함수(pdf) 변환
- $ Y_1 $과 $ Y_2 $의 결합 확률 밀도 함수는 원래 $ X_1 $과 $ X_2 $의 확률밀도 함수에서 변수 변환을 거쳐 다음과 같이 표현됩니다:
  $$
  \text{pdf}(y_1, y_2) = \text{pdf}_X(y_1 y_2, y_2(1 - y_1)) \cdot |J|
  $$
  여기서 $ |J| $는 야코비안의 절댓값이며, 위에서 $ J = Y_2 $로 주어졌으므로 이 값을 대입합니다.

##### 1. 원래 변수에서의 감마분포 PDF

각각의 $ x_1 $과 $ x_2 $는 감마분포를 따르며, 두 독립적인 감마분포의 확률밀도함수는 다음과 같습니다:

$$
\text{pdf}_X(x_1, x_2) = \frac{x_1^{\alpha_1 - 1} e^{-x_1/\beta}}{\beta^{\alpha_1} \Gamma(\alpha_1)} \cdot \frac{x_2^{\alpha_2 - 1} e^{-x_2/\beta}}{\beta^{\alpha_2} \Gamma(\alpha_2)}
$$

따라서, $ x_1 = y_1 y_2 $와 $ x_2 = y_2 (1 - y_1) $를 대입하면:

$$
\text{pdf}_X(y_1 y_2, y_2 (1 - y_1)) = \frac{(y_1 y_2)^{\alpha_1 - 1} e^{-y_1 y_2/\beta}}{\beta^{\alpha_1} \Gamma(\alpha_1)} \cdot \frac{(y_2 (1 - y_1))^{\alpha_2 - 1} e^{-y_2(1 - y_1)/\beta}}{\beta^{\alpha_2} \Gamma(\alpha_2)}
$$

이를 간단히 하면:

$$
\text{pdf}_X(y_1 y_2, y_2 (1 - y_1)) = \frac{y_1^{\alpha_1 - 1} y_2^{\alpha_1} e^{-y_1 y_2/\beta}}{\beta^{\alpha_1} \Gamma(\alpha_1)} \cdot \frac{(1 - y_1)^{\alpha_2 - 1} y_2^{\alpha_2} e^{-y_2(1 - y_1)/\beta}}{\beta^{\alpha_2} \Gamma(\alpha_2)}
$$

##### 2. 야코비안(Jacobian) 계산

야코비안 $ |J| $는 변수 변환에서의 스케일링 요인을 나타냅니다. $ x_1 = y_1 y_2 $, $ x_2 = y_2 (1 - y_1) $일 때, 야코비안 행렬 $ J $는 다음과 같습니다:

$$
J = \begin{pmatrix}
\frac{\partial x_1}{\partial y_1} & \frac{\partial x_1}{\partial y_2} \\
\frac{\partial x_2}{\partial y_1} & \frac{\partial x_2}{\partial y_2}
\end{pmatrix}
= \begin{pmatrix}
y_2 & y_1 \\
-y_2 & 1 - y_1
\end{pmatrix}
$$

야코비안 행렬의 행렬식은:

$$
|J| = y_2 \cdot (1 - y_1) - (-y_2) \cdot y_1 = y_2
$$

##### 3. 변환된 밀도 함수

이제, 새로운 변수에서의 확률밀도함수는 원래 함수에 야코비안의 절댓값을 곱한 형태로 나타낼 수 있습니다:

$$
\text{pdf}(y_1, y_2) = \text{pdf}_X(y_1 y_2, y_2 (1 - y_1)) \cdot |J|
$$

따라서:

$$
\text{pdf}(y_1, y_2) = \left( \frac{y_1^{\alpha_1 - 1} y_2^{\alpha_1} e^{-y_1 y_2/\beta}}{\beta^{\alpha_1} \Gamma(\alpha_1)} \cdot \frac{(1 - y_1)^{\alpha_2 - 1} y_2^{\alpha_2} e^{-y_2(1 - y_1)/\beta}}{\beta^{\alpha_2} \Gamma(\alpha_2)} \right) \cdot y_2
$$

정리하면:

$$
\text{pdf}(y_1, y_2) = \frac{y_1^{\alpha_1 - 1} (1 - y_1)^{\alpha_2 - 1} y_2^{\alpha_1 + \alpha_2 - 1} e^{-y_2/\beta}}{\beta^{\alpha_1 + \alpha_2} \Gamma(\alpha_1) \Gamma(\alpha_2)}
$$

#### 6. 각 함수 계산
- $ g_1(y_1) $은 $ Y_1 $의 밀도 함수로서 다음과 같이 주어집니다:
  $$
  g_1(y_1) = \frac{\Gamma(\alpha_1 + \alpha_2)}{\Gamma(\alpha_1) \Gamma(\alpha_2)} \cdot y_1^{\alpha_1 - 1} (1 - y_1)^{\alpha_2 - 1}, \quad 0 < y_1 < 1
  $$
  이는 베타분포의 확률밀도함수입니다.

- $ g_2(y_2) $는 감마분포에서 $ Y_2 \sim \text{Gamma}(\alpha_1 + \alpha_2, \beta) $로 나타납니다.

#### 7. 베타분포의 유도
- 결론적으로, $ Y_1 $은 베타분포를 따릅니다:
  $$
  Y_1 \sim \text{Beta}(\alpha_1, \alpha_2)
  $$

### 전체 요약
- $ X_1 \sim \text{Gamma}(\alpha_1, \beta) $, $ X_2 \sim \text{Gamma}(\alpha_2, \beta) $인 독립적인 두 감마분포를 변환하여 새로운 변수 $ Y_1 $과 $ Y_2 $를 정의합니다.
- 그 결과, $ Y_1 $은 베타분포 $ \text{Beta}(\alpha_1, \alpha_2) $를 따르고, $ Y_2 $는 감마분포 $ \text{Gamma}(\alpha_1 + \alpha_2, \beta) $를 따릅니다.

이 과정은 변수 변환법을 통해 베타분포를 유도하는 과정이며, 감마분포에서 베타분포를 도출하는 수학적 기법을 보여줍니다.

---

### 예 4.1.7 (p.149)
균등분포와 삼각분포에 대한 변수 변환 과정 

- $ X_1, X_2 $는 독립적으로 동일한 분포를 따르는 확률변수로, 두 변수는 균등분포 $ U(0, 1) $에서 샘플링된다고 가정합니다.
  $$
  X_1, X_2 \sim \text{iid} \, U(0, 1)
  $$
  즉, $ X_1 $과 $ X_2 $는 독립적이고 동일하게 분포된 확률변수로, $ [0, 1] $ 구간에서 균등하게 분포되어 있습니다.
  
- 새로운 변수를 다음과 같이 정의합니다:
  $$
  Y = \frac{X_1 + X_2}{2}, \quad Z = \frac{X_1 - X_2}{2}
  $$
  즉, $ Y $는 $ X_1 $과 $ X_2 $의 평균을 나타내고, $ Z $는 $ X_1 $과 $ X_2 $의 차이의 절반을 나타냅니다.

- 역변환:
  $$
  X_1 = Y + Z, \quad X_2 = Y - Z
  $$
  이를 통해 $ Y $와 $ Z $를 원래 변수 $ X_1 $, $ X_2 $로 다시 표현할 수 있습니다.

---

### 1. 균등분포 $ U(0, 1) $

#### $ X_1 $과 $ X_2 $의 분포
- $ X_1 $과 $ X_2 $는 각각 $ U(0, 1) $의 균등분포를 따릅니다. 이는 다음과 같은 확률밀도함수(PDF)를 가집니다:
  $$
  f_{X_1}(x_1) = f_{X_2}(x_2) = 1, \quad 0 \leq x_1, x_2 \leq 1
  $$
  이는 $ [0, 1] $ 구간에서 균등하게 확률이 분포되어 있음을 나타냅니다.

### 2. 새로운 변수 $ Y $와 $ Z $

이제 새로운 변수 $ Y $와 $ Z $를 도입합니다:
$$
Y = \frac{X_1 + X_2}{2}, \quad Z = \frac{X_1 - X_2}{2}
$$
이 변환은 두 변수의 평균과 차이를 표현한 것입니다. 이를 통해 $ X_1 $과 $ X_2 $가 가진 정보를 다른 방식으로 표현할 수 있습니다.

#### 역변환
위에서 정의한 $ Y $와 $ Z $를 사용하여 $ X_1 $과 $ X_2 $를 다시 표현하면:
$$
X_1 = Y + Z, \quad X_2 = Y - Z
$$

#### 야코비안(Jacobian) 계산
변수를 변환할 때, 변환에 따른 확률밀도함수의 변화를 계산하기 위해 야코비안을 구해야 합니다. 야코비안 행렬 $ J $는 다음과 같이 정의됩니다:

$$
J = \begin{pmatrix}
\frac{\partial X_1}{\partial Y} & \frac{\partial X_1}{\partial Z} \\
\frac{\partial X_2}{\partial Y} & \frac{\partial X_2}{\partial Z}
\end{pmatrix}
= \begin{pmatrix}
1 & 1 \\
1 & -1
\end{pmatrix}
$$

이 행렬의 행렬식을 계산하면:
$$
|J| = (1 \cdot (-1)) - (1 \cdot 1) = -2
$$

행렬식의 절댓값은 $ 2 $가 되며, 이 값은 변수 변환 후 확률밀도함수에 곱해져야 합니다.

---

### 3. $ Y $의 분포: 삼각분포

$ Y = \frac{X_1 + X_2}{2} $의 분포는 삼각분포를 따릅니다. 이는 두 독립적인 균등분포를 더한 값에서 도출되며, 삼각분포의 특징은 다음과 같습니다:

- 삼각분포는 $ [0, 1] $ 구간에서 균등분포의 합으로부터 나타나는 분포로, 다음과 같은 형태의 확률밀도함수를 가집니다:
  $$
  f_Y(y) = 
  \begin{cases}
    4y, & 0 \leq y \leq \frac{1}{2} \\
    4(1 - y), & \frac{1}{2} < y \leq 1
  \end{cases}
  $$
  이는 $ Y $가 두 균등분포 변수를 더해 생성되었음을 나타냅니다.

---

### 4. $ Z $의 분포

$ Z = \frac{X_1 - X_2}{2} $의 분포는 $ X_1 $과 $ X_2 $의 차이에 해당하며, 이 변수는 균등분포를 따르지만 값이 $ [-\frac{1}{2}, \frac{1}{2}] $ 구간에서 정의됩니다. 따라서 $ Z $의 확률밀도함수는 다음과 같이 표현할 수 있습니다:

$$
f_Z(z) = 1, \quad -\frac{1}{2} \leq z \leq \frac{1}{2}
$$

이는 $ Z $가 $ X_1 $과 $ X_2 $의 차이에 의해 정의되며, 해당 구간에서 균등하게 분포되어 있음을 나타냅니다.

---

### 5. 결론

이 문제에서 우리는 두 독립적인 균등분포 $ X_1 $, $ X_2 $를 새로운 변수 $ Y $와 $ Z $로 변환했습니다. 이를 통해:

- $ Y = \frac{X_1 + X_2}{2} $는 삼각분포를 따릅니다.
- $ Z = \frac{X_1 - X_2}{2} $는 $ [-\frac{1}{2}, \frac{1}{2}] $ 구간에서 균등분포를 따릅니다.

이러한 변환을 통해 $ X_1 $과 $ X_2 $를 더 쉽게 해석할 수 있고, $ Y $와 $ Z $의 분포를 각각 구할 수 있음을 알 수 있습니다.

---

## 예 4.1.8 (p.151) 목표: 
독립적인 표준 정규 분포 $X \sim N(0, 1)$, $Y \sim N(0, 1)$를 극좌표계로 변환한 후, 변환된 좌표 $R$과 $\Theta$의 분포를 구하는 과정입니다.

### 1. $X$와 $Y$의 분포

우리는 두 개의 독립적인 $N(0, 1)$ 분포를 따르는 확률 변수 $X$와 $Y$를 다루고 있습니다:
- $f_X(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}$
- $f_Y(y) = \frac{1}{\sqrt{2\pi}} e^{-\frac{y^2}{2}}$

두 변수가 독립적이므로, 이들의 결합 확률 밀도 함수는 단순히 두 개의 밀도 함수의 곱으로 나타낼 수 있습니다:
$$
f_{X,Y}(x, y) = f_X(x) f_Y(y) = \frac{1}{2\pi} e^{-\frac{x^2 + y^2}{2}}
$$
이 식은 $X$와 $Y$의 결합 분포를 나타냅니다.

### 2. 극좌표계로의 변환

이제 $X$와 $Y$를 극좌표계로 변환합니다. 변환 공식은 다음과 같습니다:
$$
R = \sqrt{X^2 + Y^2}, \quad \Theta = \tan^{-1}\left(\frac{Y}{X}\right)
$$
- $R$은 점이 원점에서 떨어진 거리, 즉 반지름을 나타내고, 
- $\Theta$는 점이 원점과 이루는 각도입니다.

이제 극좌표로 변환된 변수 $R$과 $\Theta$의 분포를 구하기 위해 **변수 변환법**을 사용하겠습니다.

### 3. 변수 변환 (Jacobian 계산)

변수 변환을 사용하려면, 우선 극좌표계에서의 **야코비안(Jacobian)** 을 구해야 합니다. 직교 좌표계에서 극좌표계로 변환할 때, 미분 행렬식(야코비안)은 다음과 같습니다:
$$
\frac{\partial(x, y)}{\partial(r, \theta)} = \begin{vmatrix}
\frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\
\frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta}
\end{vmatrix}
$$
$x = r \cos \theta$, $y = r \sin \theta$이므로:
- $\frac{\partial x}{\partial r} = \cos \theta$
- $\frac{\partial x}{\partial \theta} = -r \sin \theta$
- $\frac{\partial y}{\partial r} = \sin \theta$
- $\frac{\partial y}{\partial \theta} = r \cos \theta$

따라서 야코비안은:
$$
J = \begin{vmatrix}
\cos \theta & -r \sin \theta \\
\sin \theta & r \cos \theta
\end{vmatrix} = r
$$
따라서, 극좌표계에서의 확률 밀도 함수는 직교 좌표계에서의 밀도 함수에 야코비안 $r$을 곱한 형태로 변환됩니다:
$$
f_{R,\Theta}(r, \theta) = f_{X,Y}(x= r\cos\theta, y= r\sin\theta) \times r = \frac{1}{2\pi} e^{-\frac{r^2}{2}} \times r
$$
즉, $R$과 $\Theta$의 결합 확률 밀도 함수는 다음과 같습니다:
$$
f_{R,\Theta}(r, \theta) = \frac{r}{2\pi} e^{-\frac{r^2}{2}}
$$
여기서:
- $r$은 반지름, 즉 $R$에 해당하며,
- $\theta$는 각도 $\Theta$에 해당합니다.

### 4. $\Theta$의 분포

결합 확률 밀도 함수에서 각도 $\Theta$에 대한 밀도를 구하려면, 반지름 $r$에 대해 적분을 수행합니다:
$$
f_\Theta(\theta) = \int_0^\infty f_{R,\Theta}(r, \theta) dr = \int_0^\infty \frac{r}{2\pi} e^{-\frac{r^2}{2}} dr
$$
위 적분에서 $\theta$에 대한 부분은 없어지므로, 적분 결과는 단순히:
$$
f_\Theta(\theta) = \frac{1}{2\pi}
$$
따라서 $\Theta$는 0에서 $2\pi$ 사이에서 **균등 분포**를 따릅니다:
$$
\Theta \sim U(0, 2\pi)
$$

### 5. $R$의 분포

이제 $R$에 대한 밀도 함수를 구하겠습니다. 각도 $\theta$에 대해 적분을 수행하면 $R$의 주변 밀도 함수는 다음과 같습니다:
$$
f_R(r) = \int_0^{2\pi} f_{R,\Theta}(r, \theta) d\theta = \int_0^{2\pi} \frac{r}{2\pi} e^{-\frac{r^2}{2}} d\theta
$$
적분을 하면:
$$
f_R(r) = r e^{-\frac{r^2}{2}}
$$
이는 **레이리 분포(Rayleigh distribution)** 의 확률 밀도 함수입니다. $R^2$를 변수로 두면:
$$
R^2 \sim \chi^2_2
$$
즉, $R^2$는 자유도가 2인 **카이제곱 분포** 를 따릅니다. 또한, $R^2/2$는 모수가 1인 **지수 분포(Exp(1))** 를 따릅니다:
$$
\frac{R^2}{2} \sim \text{Exp}(1)
$$

### 6. 결론

- **반지름 $R$**: $R^2/2$는 지수 분포 $Exp(1)$를 따릅니다.
- **각도 $\Theta$**: $\Theta$는 균등 분포 $U(0, 2\pi)$를 따릅니다.

이 과정을 통해, 두 독립적인 표준 정규 분포를 극좌표계로 변환하면 반지름은 지수 분포, 각도는 균등 분포를 따르게 된다는 것을 알 수 있습니다.

---


| **분포**          | **확률 밀도 함수 (PDF)**                                                                                                       | **평균 (E[X])**                      | **분산 (Var[X])**                     | **적률생성함수 (MGF, $M_X(t)$)**                           |
|-------------------|---------------------------------------------------------------------------------------------------------------------------------|--------------------------------------|---------------------------------------|--------------------------------------------------------------|
| **정규 분포 (Normal)** | $ f(x; \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} $                                 | $ \mu $                            | $ \sigma^2 $                        | $ M_X(t) = e^{\mu t + \frac{1}{2}\sigma^2 t^2} $            |
| **지수 분포 (Exponential)** | $ f(x; \lambda) = \lambda e^{-\lambda x}, \quad x \geq 0 $                                                            | $ \frac{1}{\lambda} $              | $ \frac{1}{\lambda^2} $             | $ M_X(t) = \frac{\lambda}{\lambda - t}, \quad t < \lambda $ |
| **카이제곱 분포 (Chi-Squared)** | $ f(x; k) = \frac{1}{2^{k/2} \Gamma(k/2)} x^{k/2-1} e^{-x/2}, \quad x \geq 0 $                                        | $ k $                              | $ 2k $                              | $ M_X(t) = (1 - 2t)^{-k/2}, \quad t < \frac{1}{2} $        |
| **감마 분포 (Gamma)** | $ f(x; \alpha, \beta) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha - 1} e^{-\beta x}, \quad x \geq 0 $                     | $ \frac{\alpha}{\beta} $           | $ \frac{\alpha}{\beta^2} $          | $ M_X(t) = \left( \frac{\beta}{\beta - t} \right)^\alpha, \quad t < \beta $ |
| **베타 분포 (Beta)** | $ f(x; \alpha, \beta) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)} x^{\alpha-1} (1 - x)^{\beta-1}, \quad 0 \leq x \leq 1 $ | $ \frac{\alpha}{\alpha + \beta} $  | $ \frac{\alpha\beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)} $ | $ M_X(t) \text{는 존재하지 않음} $                                |
| **이항 분포 (Binomial)** | $ f(x; n, p) = \binom{n}{x} p^x (1 - p)^{n - x}, \quad x = 0, 1, \dots, n $                                               | $ np $                            | $ np(1 - p) $                       | $ M_X(t) = \left( 1 - p + pe^t \right)^n $                  |
| **포아송 분포 (Poisson)** | $ f(x; \lambda) = \frac{\lambda^x e^{-\lambda}}{x!}, \quad x = 0, 1, 2, \dots $                                           | $ \lambda $                        | $ \lambda $                         | $ M_X(t) = e^{\lambda(e^t - 1)} $                           |
| **스튜던트 t 분포 (Student's t)** | $ f(x; \nu) = \frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi}\Gamma\left(\frac{\nu}{2}\right)}\left(1 + \frac{x^2}{\nu}\right)^{-\frac{\nu+1}{2}} $ | $ 0 $                              | $ \frac{\nu}{\nu - 2}, \quad \nu > 2 $ | MGF는 존재하지 않음                                            |
| **F 분포 (F-distribution)** | $ f(x; d_1, d_2) = \frac{\sqrt{ \left( \frac{d_1 x}{d_2} \right)^{d_1} \left(1 + \frac{d_1 x}{d_2} \right)^{-(d_1 + d_2)/2}} }{ B(d_1/2, d_2/2) } $ | $ \frac{d_2}{d_2 - 2}, \quad d_2 > 2 $ | $ \frac{2d_2^2 (d_1 + d_2 - 2)}{d_1 (d_2 - 2)^2 (d_2 - 4)} $ | MGF는 존재하지 않음                                            |
| **베르누이 분포 (Bernoulli)** | $ f(x; p) = p^x (1 - p)^{1 - x}, \quad x = 0, 1 $                                                                    | $ p $                              | $ p(1 - p) $                       | $ M_X(t) = 1 - p + pe^t $                                  |
| **기하 분포 (Geometric)** | $ f(x; p) = (1 - p)^{x-1} p, \quad x = 1, 2, 3, \dots $                                                                 | $ \frac{1}{p} $                    | $ \frac{1 - p}{p^2} $               | $ M_X(t) = \frac{pe^t}{1 - (1 - p)e^t}, \quad t < -\ln(1-p) $ |
| **음이항 분포 (Negative Binomial)** | $ f(x; r, p) = \binom{x + r - 1}{x} p^r (1 - p)^x, \quad x = 0, 1, 2, \dots $                                       | $ \frac{r(1 - p)}{p} $             | $ \frac{r(1 - p)}{p^2} $            | $ M_X(t) = \left( \frac{pe^t}{1 - (1 - p)e^t} \right)^r, \quad t < -\ln(1-p) $ |
| **초기하 분포 (Hypergeometric)** | $ f(x; N, K, n) = \frac{\binom{K}{x}\binom{N-K}{n-x}}{\binom{N}{n}}, \quad x = \max(0, n + K - N), \dots, \min(K, n) $ | $ \frac{nK}{N} $                   | $ \frac{nK(N-K)(N-n)}{N^2(N-1)} $   | MGF는 존재하지 않음                                            |

---

### 카이제곱 분포 정의
카이제곱 분포는 정규분포를 따르는 독립 확률변수들의 제곱 합에 대한 분포입니다. 예를 들어, $ X_1, X_2, \dots, X_r $이 서로 독립이고 각 확률변수가 $ N(0, 1) $ 분포를 따른다고 가정할 때, 다음과 같이 정의된 확률변수 $ Y $는 카이제곱 분포를 따릅니다.

$$
Y = X_1^2 + X_2^2 + \dots + X_r^2
$$

여기서 $ Y $는 **자유도 $ r $** 을 가진 카이제곱 분포를 따르며, 이를 $ Y \sim \chi^2(r) $로 표기합니다.

### 카이제곱 분포와 감마 분포의 관계
카이제곱 분포는 감마 분포의 특수한 경우로 볼 수 있습니다. 일반적으로, 감마 분포 $ \text{Gam}(\alpha, \theta) $는 다음과 같은 확률밀도함수(pdf)를 가집니다.

$$
f(y; \alpha, \beta) = \frac{y^{\alpha - 1} e^{-y / \beta}}{\beta^\alpha \Gamma(\alpha)}, \quad y > 0
$$

카이제곱 분포는 감마 분포의 특수한 경우로, **형태모수 $ \alpha = \frac{r}{2} $**, **척도 모수 $ \theta = 2 $** 일 때 자유도가 $ r $인 카이제곱 분포가 됩니다. 따라서, $ Y \sim \chi^2(r) $는 $ Y \sim \text{Gam}\left(\frac{r}{2}, 2\right) $로 표현할 수 있습니다.

### 예제 설명 (예 4.2.1)
예 4.2.1에서는 $ X_1, \dots, X_r $이 독립이고 각각 표준 정규분포 $ N(0, 1) $를 따르는 경우를 다룹니다. 

- **확률변수의 정의**: $ Y = X_1^2 + X_2^2 + \dots + X_r^2 $
- **특수 사례 (예 4.1.4 (c))**: 각 $ X_i^2 $는 감마 분포 $ \text{Gam}\left(\frac{1}{2}, 2\right) $를 따릅니다. 따라서 이들의 합 $ Y $는 $ \text{Gam}\left(\frac{r}{2}, 2\right) $를 따릅니다.

### 카이제곱 분포의 확률 밀도 함수 (PDF)
자유도가 $ r $인 카이제곱 분포 $ Y \sim \chi^2(r) $의 확률 밀도 함수는 다음과 같습니다.

$$
f_Y(y) = \frac{1}{2^{r/2} \Gamma(r/2)} y^{r/2 - 1} e^{-y/2}, \quad y > 0
$$

여기서:
- $ \Gamma(r/2) $는 감마 함수로, $ r/2 $에 대한 감마 값을 계산합니다.
- $ 2^{r/2} $는 척도와 관련된 상수입니다.

### 카이제곱 분포의 성질
카이제곱 분포는 다음과 같은 중요한 성질을 가집니다.
1. **기댓값**: $ E[Y] = r $
2. **분산**: $ \text{Var}(Y) = 2r $
3. **가법성**: 두 독립적인 카이제곱 분포 $ \chi^2(r_1) $와 $ \chi^2(r_2) $를 가진 확률변수 $ Y_1 \sim \chi^2(r_1) $과 $ Y_2 \sim \chi^2(r_2) $의 합 $ Y_1 + Y_2 $는 자유도가 $ r_1 + r_2 $인 카이제곱 분포를 따릅니다.

### 요약
- **카이제곱 분포**는 서로 독립인 표준 정규분포 $ N(0, 1) $를 따르는 확률변수의 제곱 합으로 정의됩니다.
- **감마 분포**와의 관계에서 카이제곱 분포는 $ \text{Gam}\left(\frac{r}{2}, 2\right) $로 나타낼 수 있습니다.
- 자유도가 $ r $인 카이제곱 분포의 PDF는 $ f_Y(y) = \frac{1}{2^{r/2} \Gamma(r/2)} y^{r/2 - 1} e^{-y/2} $입니다.
- 카이제곱 분포의 기댓값은 $ r $, 분산은 $ 2r $입니다.

----

# 정규모집단의 표본 분포

### 기본 가정
- 주어진 랜덤 표본 $ X_1, X_2, \dots, X_n $은 서로 독립이며 동일한 정규분포 $ N(\mu, \sigma^2) $를 따릅니다. 이를 요약하여 $ X_i \sim \text{iid } N(\mu, \sigma^2) $로 표기합니다.
- 이 경우 **표본평균** $ \bar{X} $의 분포와 평균 및 분산을 구하는 것이 목표입니다.

### 표본평균의 정의
표본평균 $ \bar{X} $는 주어진 표본에 대한 산술평균으로 정의됩니다.

$$
\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i
$$

여기서 $ n $은 표본의 크기입니다.

### 표본평균의 분포 (정리 4.2.2)
정규분포를 따르는 독립 표본 $ X_1, X_2, \dots, X_n $의 표본평균 $ \bar{X} $는 다음과 같은 분포를 가집니다.

$$
\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)
$$

이를 유도하는 과정에서 중심극한정리와 정규분포의 성질을 이용할 수 있습니다. 표본의 크기 $ n $이 충분히 크다면, 비정규분포의 표본평균도 근사적으로 정규분포를 따르게 됩니다. 하지만, 여기서는 $ X_i $들이 정규분포를 따르므로 $ n $의 크기와 관계없이 $ \bar{X} $ 역시 정규분포를 따릅니다.

#### 증명 (정리 3.6.1, 3.6.2를 참고)
- 각 $ X_i \sim N(\mu, \sigma^2) $이므로, 임의의 상수 $ c $에 대해 선형 결합 $ cX_i $도 정규분포를 따릅니다.
- 표본평균 $ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i $의 분포를 구하기 위해 기대값과 분산을 계산해보겠습니다.

### 표본평균의 평균과 분산
표본평균 $ \bar{X} $의 기대값과 분산은 다음과 같이 계산할 수 있습니다.

1. **기대값** $ E(\bar{X}) $:
   $$
   E(\bar{X}) = E\left(\frac{1}{n} \sum_{i=1}^n X_i\right) = \frac{1}{n} \sum_{i=1}^n E(X_i) = \frac{1}{n} \cdot n \cdot \mu = \mu
   $$

   따라서, 표본평균 $ \bar{X} $의 기대값은 모평균 $ \mu $와 같습니다.

2. **분산** $ \text{Var}(\bar{X}) $:
   $$
   \text{Var}(\bar{X}) = \text{Var}\left(\frac{1}{n} \sum_{i=1}^n X_i\right) = \frac{1}{n^2} \sum_{i=1}^n \text{Var}(X_i) = \frac{1}{n^2} \cdot n \cdot \sigma^2 = \frac{\sigma^2}{n}
   $$

   따라서, 표본평균의 분산은 모분산 $ \sigma^2 $를 표본 크기 $ n $으로 나눈 값입니다.

### 요약
- **표본평균의 분포**: $ \bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) $
- **기대값**: $ E(\bar{X}) = \mu $
- **분산**: $ \text{Var}(\bar{X}) = \frac{\sigma^2}{n} $

이 결과는 정규분포의 선형성 및 가법성을 보여주는 중요한 사례입니다. 정규분포를 따르는 모집단의 표본평균도 정규분포를 따르며, 이는 통계적 추론에서 표본평균을 모수 추정에 사용하는 근거가 됩니다.

---

### 1. 표본분산 $ S^2 $의 정의

표본분산 $ S^2 $은 다음과 같이 정의됩니다:

$$
S^2 = \frac{1}{n - 1} \sum_{i=1}^{n} (X_i - \bar{X})^2
$$

여기서:
- $ X_1, X_2, \dots, X_n $은 서로 독립이며 동일한 정규 분포 $ N(\mu, \sigma^2) $를 따르는 표본입니다.
- $ \bar{X} $는 표본평균으로, $ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i $로 정의됩니다.

### 2. 표본평균 $ \bar{X} $와 표본분산 $ S^2 $의 독립성

정규분포에서 **표본평균 $ \bar{X} $와 표본분산 $ S^2 $는 서로 독립** 입니다. 이는 적률생성함수의 분해 성질을 통해 증명할 수 있습니다. 특히, 정규분포의 경우에만 이 독립성이 성립하며, 이는 **카이제곱 분포의 가법성** 을 이용하여 보여줄 수 있습니다.

### 3. 표본분산의 분포

표본분산 $ S^2 $의 분포는 다음과 같은 형태를 가집니다:

$$
\frac{(n - 1) S^2}{\sigma^2} \sim \chi^2(n - 1)
$$

여기서:
- $ \chi^2(n - 1) $은 **자유도가 $ n - 1 $** 인 카이제곱 분포입니다.
- 즉, $ (n - 1) S^2 / \sigma^2 $은 카이제곱 분포를 따르므로, 표본분산 $ S^2 $는 모분산 $ \sigma^2 $에 비례하는 형태로 카이제곱 분포를 따릅니다.

#### 증명 스케치

표본 분산의 분포는 다음과 같은 과정을 통해 유도할 수 있습니다:

1. **분산의 계산**:
   $$
   \sum_{i=1}^n (X_i - \mu)^2 = \sum_{i=1}^n (X_i - \bar{X})^2 + n (\bar{X} - \mu)^2
   $$

   이 식에서 $\sum_{i=1}^n (X_i - \mu)^2$은 전체 편차 제곱합이며, 이를 표본의 편차 제곱합 $ \sum_{i=1}^n (X_i - \bar{X})^2 $와 편차 제곱 $ n (\bar{X} - \mu)^2 $로 분해할 수 있습니다.

   양변을 $\sigma^2$으로 나누면:
   $$
   \sum_{i=1}^n \left(\frac{X_i - \mu}{\sigma}\right)^2 = \frac{(n-1)S^2}{\sigma^2} + \left(\frac{\bar{X} - \mu}{\sigma /\sqrt{n}}\right)^2
   $$

   여기서:
   - $\sum_{i=1}^n \left(\frac{X_i - \mu}{\sigma}\right) \sim N(0,1)$
   - $\sum_{i=1}^n \left(\frac{X_i - \mu}{\sigma}\right)^2 \sim \chi^2(n)$
   - $\left(\frac{\bar{X} - \mu}{\sigma /\sqrt{n}}\right)\sim N(0,1)$
   - $\left(\frac{\bar{X} - \mu}{\sigma /\sqrt{n}}\right)^2 \sim \chi^2(1)$
   - 카이제곱분포의 가법성에 따라:
      - $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$

2. **카이제곱 분포의 가법성**:
   - $ (n - 1) S^2 / \sigma^2 $와 $ \left( \frac{\sqrt{n}(\bar{X} - \mu)}{\sigma} \right)^2 $는 서로 독립이며, 각각 카이제곱 분포를 따릅니다.
   - 이들을 합하면 자유도가 $ n $인 카이제곱 분포가 됩니다. 따라서 $(n - 1) S^2 / \sigma^2 $ 역시 자유도가 $ n - 1 $인 카이제곱 분포를 따릅니다.

### 4. 표본분산의 평균과 분산

표본분산 $ S^2 $의 기대값과 분산은 다음과 같습니다:

- **기대값**:
  $$
  E\left(\frac{(n-1)S^2}{\sigma^2} \right) = n-1\\
  \frac{n-1}{\sigma^2}E(S^2)=n-1\\
  E(S^2)=\sigma^2
  $$

  이는 $ S^2 $가 모분산 $ \sigma^2 $의 불편추정량임을 의미합니다. 즉, 표본분산은 모분산을 추정하는 데 있어서 편향되지 않습니다.

- **분산**:
  $$
  Var\left(\frac{(n-1)S^2}{\sigma^2}\right)=2(n-1)\\
  \frac{(n-1)^2}{\sigma^4}Var(S^2)=2(n-1)\\
  \text{Var}(S^2) = \frac{2\sigma^4}{n - 1}
  $$

  표본분산의 분산은 표본 크기 $ n $이 증가함에 따라 감소합니다. 이는 표본 크기가 커질수록 표본분산의 추정이 더 정확해짐을 나타냅니다.

### 요약

1. **표본분산의 정의**: $ S^2 = \frac{1}{n - 1} \sum_{i=1}^n (X_i - \bar{X})^2 $
2. **표본평균과 표본분산의 독립성**: 정규분포에서는 $ \bar{X} $와 $ S^2 $가 서로 독립입니다.
3. **표본분산의 분포**: $ \frac{(n - 1) S^2}{\sigma^2} \sim \chi^2(n - 1) $
4. **표본분산의 평균과 분산**:
   - 평균: $ E(S^2) = \sigma^2 $
   - 분산: $ \text{Var}(S^2) = \frac{2\sigma^4}{n - 1} $

이러한 결과는 통계적 추론에서 표본분산을 이용하여 모분산을 추정하는 데 중요한 근거를 제공합니다.

---

### t-분포의 정의와 유도

- **t-분포**는 정규 분포에서 모분산 $ \sigma^2 $를 알지 못할 때, 모평균에 대한 추론을 위해 사용되는 분포입니다.
- $ Z \sim N(0, 1) $이고, $ V \sim \chi^2(r) $이며, $ Z $와 $ V $가 서로 독립이라고 가정할 때, 다음과 같은 비율로 정의되는 확률변수 $ X $는 자유도가 $ r $인 t-분포를 따릅니다.

  $$
  X = \frac{Z}{\sqrt{V / r}} \sim t(r)
  $$

여기서 **자유도 $ r $** 은 $ V $의 자유도에 해당하며, t-분포의 모양을 결정하는 중요한 모수입니다.

### 스튜던트화 표본평균의 분포

정리 4.2.3에 따라, 모평균 $ \mu $에 대한 추론에서 **표본평균** $ \bar{X} $와 **표본분산** $ S^2 $를 이용하여 t-분포를 구성할 수 있습니다.

- **t-통계량** $ T $의 정의:
  $$
  T = \frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n - 1)
  $$

여기서:
- $ \bar{X} $는 표본평균이며, $ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i $입니다.
- $ S^2 $는 표본분산으로, $ S^2 = \frac{1}{n - 1} \sum_{i=1}^n (X_i - \bar{X})^2 $입니다.
- $ n $은 표본 크기입니다.

#### 유도 과정

t-분포의 통계량 $ T $는 다음과 같은 과정을 통해 유도됩니다.

1. **표본평균과 모평균의 차이 표준화**:
   $$
   T = \frac{\bar{X} - \mu}{S / \sqrt{n}}
   $$

2. **표본분산을 통한 비율로 표현**:
   $$
   T = \left(\frac{\bar{X} - \mu}{\sigma / \sqrt{n}}\right) \cdot \left(\frac{\sigma}{S}\right) \\
   = \frac{\bar{X}-\mu}{\sigma / \sqrt{n}}\cdot \sqrt{\frac{(n-1)S^2/\sigma^2}{n-1}}^{(-1)}\\
   = Z \cdot \sqrt{\frac{V}{n-1}}^{(-1)} \sim t(n-1)
   $$

3. **카이제곱 분포와 표본평균의 독립성 활용**:
   - 표본평균과 표본분산은 서로 독립이며, $ \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n - 1) $을 이용하여 최종적으로 $ T $가 자유도 $ n - 1 $인 t-분포를 따름을 보일 수 있습니다.

$$
Z \sim N(0, 1), \ V \sim \chi^2(n-1)
$$

따라서, $ T \sim t(n - 1) $임을 알 수 있으며, 이는 모평균에 대한 추론에서 중요한 역할을 합니다.

### t-분포를 활용한 모평균 추론

정규 모집단의 모평균 추론을 위해서는 **Z-검정** 또는 **t-검정**을 사용할 수 있습니다.

- **Z-검정**: 모분산 $ \sigma^2 $을 알고 있을 때, 표본평균의 분포는 정규분포를 따릅니다.
- **t-검정**: 모분산을 모를 때, 표본분산 $ S^2 $를 사용해 표본평균의 분포가 t-분포를 따르도록 설정하여 모평균에 대한 검정을 수행합니다.

따라서, $ \sigma $를 모를 때는 t-분포를 사용하여 **신뢰구간 계산**이나 **가설 검정**을 수행하게 됩니다.

---

### 요약

1. **t-분포 정의**: $ X = \frac{Z}{\sqrt{V / r}} \sim t(r) $
2. **t-통계량**: $ T = \frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n - 1) $
   - 정규모집단의 스튜던트화 표본평균
   - 표준화 표본평균은 $\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}$
3. **모평균 추론**:
   - 모분산을 아는 경우: Z-검정을 사용
   - 모분산을 모르는 경우: t-검정을 사용

t-분포는 정규분포와 유사한 형태를 가지며, 표본 크기가 작을 때 유용하게 사용됩니다. 표본 크기가 충분히 크면 t-분포는 정규분포에 근사하게 됩니다.

---


### 1. F 분포의 정의 (예 4.2.4)
- $ V_1 \sim \chi^2(r_1) $, $ V_2 \sim \chi^2(r_2) $: 두 변수 $ V_1 $과 $ V_2 $는 각각 자유도 $ r_1 $과 $ r_2 $를 가지는 카이제곱 분포를 따릅니다.
- 서로 독립: $ V_1 $과 $ V_2 $는 독립적입니다.
- F 분포: 두 카이제곱 분포의 비율을 특정한 형태로 변환한 변수 $ X $는 F 분포를 따릅니다.
  $$
  X = \frac{(V_1 / r_1)}{(V_2 / r_2)} \sim F(r_1, r_2)
  $$
  즉, $ X $는 자유도 $ (r_1, r_2) $의 F 분포를 따르는 변수입니다.

### 2. F 분포의 성질 (정리 4.2.5)
정리 4.2.5에서는 F 분포가 가지는 몇 가지 성질에 대해 설명하고 있습니다.

- **첫 번째 성질**:
  $$
  X \sim F(r_1, r_2) \Rightarrow \frac{1}{X} \sim F(r_2, r_1)
  $$
  즉, 만약 $ X $가 자유도 $ (r_1, r_2) $의 F 분포를 따른다면, $ \frac{1}{X} $는 자유도 $ (r_2, r_1) $의 F 분포를 따릅니다.
  
  $$
  F_{1 - \alpha}(r_1, r_2) = \frac{1}{F_{\alpha}(r_2, r_1)}
  $$
  여기서 $ F_{1 - \alpha}(r_1, r_2) $는 자유도 $ (r_1, r_2) $에서 신뢰구간 $ 1 - \alpha $에 해당하는 F 분포의 상한값을 의미하며, $ F_{\alpha}(r_2, r_1) $는 자유도 $ (r_2, r_1) $에서 신뢰구간 $ \alpha $에 해당하는 값입니다. 이 관계는 F 분포의 비대칭성을 나타냅니다.

- **두 번째 성질**:
  $$
  X \sim t(r) \Rightarrow X^2 \sim F(1, r)\\
  X = \frac{Z}{\sqrt{V/r}} \to X^2 = \frac{Z^2}{V/r}
  $$
  즉, 만약 $ X $가 자유도 $ r $인 t-분포를 따른다면, $ X^2 $는 자유도 $ (1, r) $의 F 분포를 따릅니다. 이는 t-분포와 F-분포 간의 관계를 설명하는 중요한 성질입니다.

  또한, t-분포의 신뢰구간을 F 분포로 변환할 수 있는 관계가 있습니다.
  $$
  t_{\alpha / 2}^2(r) = F_{\alpha}(1, r)
  $$
  이 식은 t-분포의 특정 신뢰구간 값 $ t_{\alpha / 2}^2(r) $이 F 분포의 상한값 $ F_{\alpha}(1, r) $과 동일함을 나타냅니다. 이는 F 분포와 t-분포가 통계적 검정에서 밀접하게 연결되어 있음을 보여줍니다.

---

### 1. **모분산 추론의 개념**
모분산 추론은 모집단의 분산 $ \sigma^2 $에 대한 정보를 표본을 이용해 추정하거나 검정하는 통계적 방법입니다. 여기서는 정규분포 $ N(\mu, \sigma^2) $를 따르는 모집단의 모분산을 표본 분산 $ S^2 $을 사용해 추정하는 과정과 관련된 이론을 다룹니다.

### 2. **표본 분산 $ S^2 $**
표본의 분산 $ S^2 $은 다음과 같이 정의됩니다.
$$
S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2
$$
여기서:
- $ X_1, X_2, \ldots, X_n $은 모집단에서 추출된 표본입니다.
- $ \overline{X} $는 표본평균입니다.
- $ n $은 표본의 크기입니다.

### 3. **카이제곱 분포와 모분산 추정**
정규모집단에서 추출된 표본의 경우, 다음의 중요한 결과가 성립합니다.
$$
\frac{(n-1) S^2}{\sigma^2} \sim \chi^2(n-1)
$$

여기서:
- $ \chi^2(n-1) $은 자유도 $ n-1 $인 카이제곱 분포입니다.
- 이 결과는 표본 분산 $ S^2 $이 모집단의 모분산 $ \sigma^2 $를 기준으로 카이제곱 분포를 따른다는 것을 의미합니다.

### 4. **증명 개요**
이 결과는 다음과 같이 증명할 수 있습니다:
- 모집단이 $ N(\mu, \sigma^2) $인 경우, 표본의 각 관측치 $ X_i $는 $ N(\mu, \sigma^2) $를 따릅니다.
- 표본평균 $ \overline{X} $는 $ N\left(\mu, \frac{\sigma^2}{n}\right) $를 따릅니다.
- $ \sum_{i=1}^{n} (X_i - \overline{X})^2 $은 모집단의 분산 $ \sigma^2 $을 기준으로 자유도 $ n-1 $인 카이제곱 분포를 따릅니다.

이 성질은 모분산 $ \sigma^2 $에 대한 검정 및 신뢰구간을 설정하는 데 사용됩니다.

### 5. **모분산에 대한 신뢰구간**
위 결과를 통해 모분산 $ \sigma^2 $에 대한 신뢰구간을 구할 수 있습니다. 신뢰구간은 다음과 같습니다.
$$
\left( \frac{(n-1) S^2}{\chi^2_{\alpha/2, n-1}}, \frac{(n-1) S^2}{\chi^2_{1-\alpha/2, n-1}} \right)
$$

여기서:
- $ \chi^2_{\alpha/2, n-1} $ 및 $ \chi^2_{1-\alpha/2, n-1} $은 각각 카이제곱 분포의 상/하 분위수입니다.
- $ \alpha $는 유의수준입니다.

이 신뢰구간은 표본 분산 $ S^2 $을 이용하여 모집단의 모분산 $ \sigma^2 $에 대한 신뢰할 수 있는 추정을 제공합니다.

### **결론**
정규모집단의 모분산 추론에서 표본 분산 $ S^2 $은 중요한 역할을 합니다. $ \frac{(n-1) S^2}{\sigma^2} \sim \chi^2(n-1) $ 관계를 통해 모분산에 대한 검정과 신뢰구간 설정이 가능해지며, 이를 통해 모집단의 특성에 대한 보다 정확한 추론이 가능합니다.

---

## 1. **두 정규모집단의 모분산 비교**
두 개의 서로 독립적인 정규모집단 $ X_1, \ldots, X_m \sim N(\mu_1, \sigma_1^2) $와 $ Y_1, \ldots, Y_n \sim N(\mu_2, \sigma_2^2) $가 주어져 있으며, 각 모집단의 표본 분산 $ S_1^2 $과 $ S_2^2 $을 이용해 모분산의 비 $ \frac{\sigma_1^2}{\sigma_2^2} $를 비교하는 것이 목표입니다.

### 2. **표본 분산의 정의**
- **첫 번째 표본 분산** $ S_1^2 $:
$$
S_1^2 = \frac{1}{m-1} \sum_{i=1}^{m} (X_i - \overline{X})^2
$$
여기서 $ \overline{X} $는 첫 번째 표본의 평균입니다.

- **두 번째 표본 분산** $ S_2^2 $:
$$
S_2^2 = \frac{1}{n-1} \sum_{i=1}^{n} (Y_i - \overline{Y})^2
$$
여기서 $ \overline{Y} $는 두 번째 표본의 평균입니다.

### 3. **F-분포의 정의 및 성질**
두 표본 분산의 비율을 구할 때 F-분포를 사용합니다. F-분포는 다음과 같이 정의됩니다:
$$
F = \frac{((m-1)S_1^2 / \sigma_1^2) / (m-1)}{((n-1)S_2^2 / \sigma_2^2) / (n-1)}
$$

$$
\text{where }
\frac{(k-1) S^2}{\sigma^2} \sim \chi^2(k-1)
$$

위 식을 정리하면:
$$
F = \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2}
$$

F-분포의 성질에 의해, 두 표본 분산의 비 $ \frac{S_1^2}{S_2^2} $은 모분산 비 $ \frac{\sigma_1^2}{\sigma_2^2} $를 추정하는 데 사용될 수 있습니다.

### 4. **F-분포의 귀결**
위 식에서 F-분포는 자유도가 각각 $ m-1 $과 $ n-1 $인 두 카이제곱 분포의 비율을 따릅니다:
$$
F \sim F(m-1, n-1)
$$

여기서:
- $ m-1 $은 첫 번째 표본의 자유도입니다.
- $ n-1 $은 두 번째 표본의 자유도입니다.

### 5. **두 모분산 비의 추론**
모분산 비 $ \frac{\sigma_1^2}{\sigma_2^2} $에 대한 추론은 다음과 같은 방식으로 이루어집니다:
- 검정 통계량 $ F = \frac{S_1^2}{S_2^2} $을 계산하여, F-분포의 특정 자유도 $ (m-1, n-1) $에 대한 임계값과 비교합니다.
- 이를 통해 두 모집단의 분산이 동일한지 여부에 대해 가설 검정을 수행할 수 있습니다.

### 6. **가설 검정의 단계**
1. **귀무가설** $ H_0 $: $ \sigma_1^2 = \sigma_2^2 $ (두 모집단의 모분산이 같다)
2. **대립가설** $ H_1 $: $ \sigma_1^2 \neq \sigma_2^2 $ (두 모집단의 모분산이 다르다)
3. **검정 통계량**:
   $$
   F = \frac{S_1^2}{S_2^2}
   $$
4. **임계값**: F-분포의 자유도 $ (m-1, n-1) $에 대한 임계값을 사용하여 $ F $의 값을 비교합니다.
5. **결론**:
   - 계산된 F-값이 임계값보다 크거나 작으면 귀무가설을 기각합니다.
   - 그렇지 않으면 귀무가설을 채택하여 두 모집단의 모분산이 동일하다고 결론 내립니다.

### **결론**
두 정규모집단의 모분산 비교는 표본 분산 비율을 사용하여 F-분포를 통해 수행됩니다. 이를 통해 두 모집단의 모분산 비 $ \frac{\sigma_1^2}{\sigma_2^2} $에 대한 추론과 가설 검정이 가능하며, 각 표본 분산의 비를 검정 통계량으로 사용하여 모집단의 분산이 같은지 검토할 수 있습니다.

---

F 분포는 두 모집단 분산의 비율을 비교할 때 사용하며, **비대칭적**입니다. 일반적으로 오른쪽 꼬리가 긴 형태로, F 분포에서 큰 값을 가질 확률이 왼쪽보다 더 적습니다. 이제 이 특성을 바탕으로 신뢰구간을 설정할 때 왜 한쪽은 곱하고 다른 한쪽은 나누는지를 구체적으로 살펴보겠습니다.

---

### 문제 설정

두 모집단의 분산을 $\sigma_X^2$와 $\sigma_Y^2$로 하고, 이들로부터 추출한 표본 분산을 각각 $S_X^2$와 $S_Y^2$로 합니다. 이제 우리는 분산의 비율 $\frac{\sigma_X^2}{\sigma_Y^2}$에 대한 신뢰구간을 구하려고 합니다. 

표본 분산 비율인 $\frac{S_X^2}{S_Y^2}$이 자유도가 $(n_X - 1)$과 $(n_Y - 1)$인 F 분포를 따른다고 가정하면, **F 통계량을 다음과 같이 정의**할 수 있습니다:
$$
F = \frac{S_X^2 / \sigma_X^2}{S_Y^2 / \sigma_Y^2} \sim F(n_X - 1, n_Y - 1)
$$

---

### 양측 신뢰구간 설정

1. **양측 신뢰구간**에서는 분산 비율이 특정 범위 안에 있을 확률이 $1 - \alpha$가 되도록 하려면 F 분포의 **양쪽 꼬리**에 해당하는 분위수를 사용합니다.  
   - **하한 임계값**: F 분포의 하위 $\alpha/2$ 분위수인 $F_{\alpha/2, \, n_X - 1, \, n_Y - 1}$.
   - **상한 임계값**: F 분포의 상위 $1 - \alpha/2$ 분위수인 $F_{1 - \alpha/2, \, n_X - 1, \, n_Y - 1}$.
   
2. 따라서 분산 비율에 대한 **$1 - \alpha$ 신뢰구간**은 다음과 같이 정의됩니다:
   $$
   \frac{S_X^2}{S_Y^2} \cdot \frac{1}{F_{1 - \alpha/2, \, n_X - 1, \, n_Y - 1}} \leq \frac{\sigma_X^2}{\sigma_Y^2} \leq \frac{S_X^2}{S_Y^2} \cdot F_{\alpha/2, \, n_X - 1, \, n_Y - 1}
   $$

이 식에서 하한에는 $F$의 상위 임계값의 역수를 곱하고, 상한에는 $F$의 하위 임계값을 곱하게 됩니다.

---

### 단측 신뢰구간 설정

**단측 신뢰구간**에서는 특정 방향으로 분산 비율이 편향될 가능성을 검토합니다. 두 경우를 나눠서 설명하겠습니다.

#### 1. 오른쪽 단측 신뢰구간 (우측 꼬리)

- $\sigma_X^2$가 $\sigma_Y^2$보다 클 가능성을 검정할 때는 **오른쪽 꼬리**에서 F 분포의 **상위 임계값**을 기준으로 합니다.
- 신뢰수준이 $1 - \alpha$인 경우, **분산 비율이 F 분포의 상위 $1 - \alpha$ 분위수 이상일 확률**이 $\alpha$보다 작으면 귀무가설을 기각할 수 있습니다.
- 따라서 오른쪽 신뢰구간은 다음과 같이 설정됩니다.
  $$
  \frac{\sigma_X^2}{\sigma_Y^2} \geq \frac{S_X^2}{S_Y^2} \cdot \frac{1}{F_{1 - \alpha, \, n_X - 1, \, n_Y - 1}}
  $$
- 여기서 $F_{1 - \alpha, \, n_X - 1, \, n_Y - 1}$의 역수를 곱하는 이유는, **F 값이 작아야** 분산 비율이 충분히 커져서 상한을 만족하기 때문입니다.

#### 2. 왼쪽 단측 신뢰구간 (좌측 꼬리)

- $\sigma_X^2$가 $\sigma_Y^2$보다 작을 가능성을 검정할 때는 **왼쪽 꼬리**에서 F 분포의 **하위 임계값**을 기준으로 합니다.
- 신뢰수준이 $1 - \alpha$인 경우, 분산 비율이 F 분포의 하위 $\alpha$ 분위수 이하일 확률이 $\alpha$보다 작으면 귀무가설을 기각할 수 있습니다.
- 따라서 왼쪽 신뢰구간은 다음과 같이 설정됩니다.
  $$
  \frac{\sigma_X^2}{\sigma_Y^2} \leq \frac{S_X^2}{S_Y^2} \cdot F_{\alpha, \, n_X - 1, \, n_Y - 1}
  $$
- 여기서 $F_{\alpha, \, n_X - 1, \, n_Y - 1}$을 곱하는 이유는, **F 값이 작아야** 분산 비율이 충분히 작아져서 하한을 만족하기 때문입니다.

---

### 요약

- **양측 신뢰구간**에서는 F 분포의 상위와 하위 임계값을 이용해 분산 비율이 양쪽 꼬리에서 벗어날 확률이 각각 $\alpha/2$가 되도록 설정합니다.
- **단측 신뢰구간**에서는 특정 방향으로만 극단값을 확인하기 때문에, 오른쪽 신뢰구간에서는 F 분포의 **상위 임계값의 역수**를 곱하고, 왼쪽 신뢰구간에서는 **하위 임계값을 곱하는 방식**을 사용합니다.

이렇게 함으로써 분산 비율에 대한 정확한 신뢰구간을 설정할 수 있습니다.