# 적률생성함수(Moment Generating Function), 확률생성함수(Probability Generating Function)

- toc: true
- badges: false
- comments: true
- author: Jay Sung
- categories: [ ___  E. STATISTICS _____________ > 統計検定 準1級 개념정리]

- - -
- - -

| 대분류 | 소분류 | 학습내용|
| - | - | - |
| 확률과 확률변수 | 확률분포와 모함수 | 적률모함수, 확률모함수 |

- - -
# 적률(moment) & 중심적률 & 표준화적률

**_[수학적 관점]_**

상수 c에 대한 x의 n차 적률은
$$\mu_n = \int_{-\infty}^{\infty}(x-c)^nf(x)dx$$
로 정의된다.


$\space$

**_[통계적 관점]_**

확률변수 $X$ 에 대해 $X^r$ 에 대한 기댓값
$$\mu_r' = E[X^r]$$

*(discrete random variable 일 때)* $$\mu_r' = E[X^r] = \sum\limits_xX^r\cdot f(x)$$
*(continuous random variable 일 때)* $$\mu_r' = E[X^r] = \int_{-\infty}^{\infty}X^r\cdot f(x)dx$$
을 **r차 적률** ($r^{th} \space moment$)이라고 하며, 평균 중심으로 적률을 구한 것을

$$\mu_r = E[(X-\mu)^r]$$
을 평균 $\mu = E(x)$에 대한 **$X$의 r차 중심적률**($r^{th} \space central \space moment$)이라 정의한다.

r차 중심적률을 표준편차의 r제곱으로 나눈 **$X$의 r차 표준화적률**을 아래와 같이 정의할 수 있다.
$$\tilde{\mu}_n = \cfrac{\mu_n}{\sigma^n} = \cfrac{E[(x-\mu)^n]}{\sigma^n} = E[(\cfrac{x-\mu}{\sigma})^n]$$

|이름|기호|정의|기댓값 형태| 통계량과의 관계|
|-|:-:|:-:|:-:|:-:|
|적률| $\mu_n'$|$\int_{-\infty}^{\infty}x^nf(x)dx$|$E[X^n]$|평균 = $\mu_1'$|
|중심적률|$\mu_n$|$\int_{-\infty}^{\infty}(x-\mu)^nf(x)dx$|$E[(X - \mu)^n]$|분산 = $\mu_2$|
|표준화적률|$\tilde{\mu}_n$|$\cfrac{\mu_n}{\sigma^n}$|$E[(\cfrac{X-\mu}{\sigma})^n]$|왜도 = $\tilde{\mu}_3$ 첨도 = $\tilde{\mu}_4$|

- - -
# 생성 함수(모함수)란?
수학에서 어떤 수열 $a_n$ (n은 자연수)에 대하여,
$$f(x) = a_0 + a_1x + a_2x^2 + \dots + a_nx^n + \dots = \sum\limits^{\infty}_{k=0}a_kx^k$$
와 같이 미지수의 계수가 수열의 각 항으로 되어 있는 멱급수 형태의 함수를 **생성함수** (generating function)라고 한다.

- - -
# 적률생섬함수 (MGF; moment generating function)

적률생섬함수는 위에서 배운 세가지 적률
- 적률
- 중심적률
- 표준화적률

중 첫번째 '적률' (원점에 대한 적률)을 생성한다. 물론 적률은 적분을 통해 구할 수 있지만,

**적률생성함수를 한 번 구해놓으면 n차 적률을 아주 쉽게 구할 수 있다**.

$\space$

## 적률생섬함수의 정의

확률변수 $X$가 있을 때, $e^{tX}$의 기댓값이 적률생섬함수가 된다. 즉,
$$M_X(t) = E[e^{tX}]$$
를 확률 변수 X의 적률생성함수 라고 하고, 연속확률변수라면 아래와 같이 구할 수 있다.
$$M_X(t) = E[e^{tX}] = \int_{-\infty}^{\infty}e^{tx}f(x)dx$$

## 적률생섬함수가 적률을 생성하는 원리

$e^{tX}$를 변수를 t로 생각하여 테일러 전개하면,

$$e^{tX} = e^{aX} + \cfrac{Xe^{aX}}{1!}(t-a) + \cfrac{X^2e^{aX}}{2!}(t-a)^2 + \cfrac{X^3e^{aX}}{3!}(t-a)^3 + \dots$$

a 에 0을 집어넣어, 매클로린 급수를 만들면
$$e^{tX} = 1 + Xt + \cfrac{X^2}{2!}t^2 + \cfrac{X^3}{3!}t^3 + \dots $$

가 되고, 이를 적률생성함수 식에 대입하면
$$M_x(t) = E[e^{tX}] = E[1 + Xt + \cfrac{X^2}{2!}t^2 + \cfrac{X^3}{3!}t^3 + \dots]$$
가 된다.

이를 기대값 항을 분리해서 써주면
$$
\begin{aligned}
M_x(t) = E[e^{tX}] &= 1 + E[Xt] + E[\cfrac{X^2}{2!}t^2] + E[\cfrac{X^3}{3!}t^3] + \dots\\
&= 1 + E[X]t + \cfrac{E[X^2]}{2!}]t^2 + \cfrac{E[X^3]}{3!}t^3 + \dots\end{aligned}$$


**_[1번 미분]_**

$$\cfrac{dM_X(t)}{dt} = E[X] + \cfrac{E[X^2]}{1!}]t + \cfrac{E[X^3]}{2!}t^2 + \dots$$

t에 0을 넣으면,

$$\cfrac{dM_X(t)}{dt} = E[X]$$

1차 적률이 나온다. 즉, 적률생성함수를 한번 미분하고 t에 0을 넣으면 1차적률이다.




**_[2번 미분]_**

$$\cfrac{d^2M_X(t)}{dt^2} = E[X^2] + \cfrac{E[X^3]}{1!}t + \dots$$

t에 0을 넣으면,

$$\cfrac{d^2M_X(t)}{dt^2} = E[X^2]$$

2차 적률이 나온다. 즉, 적률생성함수를 두번 미분하고 t에 0을 넣으면 2차적률이다.


**_[n번 미분]_**

n번 미분하고 t에 0을 넣으면,

$$\cfrac{d^nM_X(t)}{dt^n} = E[X^n]$$

n차 적률이 나온다.

> 이와 같은 성질은, 확률변수의 분포형태가 적률생성함수에 의하여 유일하게 결정됨을 보여준다. 이러한 사실은 분포의 형태가 적률에 의해 표현된다는 점으로 미루어 짐작 될 수 있다.
>
> **확률변수 X와 Y가 같은 적률생성함수를 가지면 두 확률변수는 같은 확률밀도함수를 가진다.**

- - -
## (예) 이항확률변수 $X \sim B(n,p)$의 적률생성함수와 그 활용

$$
\begin{aligned}M_X(t) = E(e^{tX}) &= \sum\limits^n_{x=0}e^{tx}\binom{n}{x}p^x(1-p)^{n-x}\\
&= \sum\limits^n_{x=0}\binom{n}{x}(pe^t)^x(1-p)^{n-x}\\
&= (1-p+pe^t)^n \end{aligned}$$

그러므로, 이항확률변수 $X \sim B(n,p)$ 의 평균과 분산은 다음과 같이 계산된다. (단, p+q = 1)
$$
\begin{aligned}
M_X^{(1)}(t) &= n(q+pe^t)^{n-1}\cdot pe^t \\
M_X^{(2)}(t) &= n(q+pe^t)^{n-1}\cdot pe^t + pe^t\cdot n(n-1)(q+pe^t)^{n-2}pe^t \end{aligned}$$

이고, t=0 을 대입하면,

$$
\begin{aligned}
M_X^{(1)}(0) &= n(q+p)^{n-1}p \\
&= np\\
&= E(X)\\
& \space \\
M_X^{(2)}(0) &= n(q+p)^{n-1}p + pn(n-1)(q+p)^{n-2}p \\
&= np + p^2n(n-1)\\
&= E(X^2) \end{aligned}$$

이 된다. 그러므로,
$$\begin{aligned}
Var(X) &= np + p^2n(n-1) - (np)^2\\
&= np - np^2\\
&= np(1-p)
\end{aligned}$$


- - -
- - -
# 확률생성함수 (Probability generating function)

이산형 확률변수 $X$가 음이 아닌 정수값 0,1,2,...를 가질 수 있을 때, 확률변수 $X$의 성질을 파악하는데 다음과 같이 정의 되는 확률생성함수를 이용할 수 있다. 편의상 $P(X = j) = p_j$로 표기한다.

이산형 확률변수 $X$의 **확률생성함수**는 이하와 같이 정의된다.
$$ G_X(s) = E(s^X) = \sum\limits^{\infty}_{j=0}p_js^j$$

이와 같이 정의된 확률생성함수 $G_X(s)$는 $|s| \leq 1$ 에 대하여 다음과 같은 성질들을 가진다.

(확률생성함수라는 이름의 유래는 아래의 성질3으로 부터 온것으로 여겨진다.)

1. $E(X) = G_X'(1) = \left. \cfrac{d}{ds}G_X(s) \right|_{s=1}$

$\space$

2. 서로 독립인 확률변수 X와 Y의 합인 Z = X + Y의 확률생성함수는
$G_Z(s) = G_X(s)\cdot G_Y(s)$ 이다.

$\space$

3. $P(X=k) = \left. (1/k!)\cfrac{d^k}{ds^k}G_X(s) \right|_{s=0}$