# 一般化モーメント法



## モーメント法

モーメント法（method of moment）は統計的推定における方法の1つで、母集団におけるモーメント（母平均など）を標本におけるモーメント（標本平均など）で置き換えて推定を行う。

確率変数$X$の分布が$k$次元の未知のパラメータ$\theta = (\theta_1, \cdots, \theta_k)$をもつとする。このとき、

$$
E[m(X, \theta)]
= E
\begin{bmatrix}
m_1(X, \theta)\\
\vdots\\
m_k(X, \theta)\\
\end{bmatrix}
= 0
$$

を満たすように$k$個の関数（スコア関数）$m_1(\cdot, \cdot), \cdots, m_k(\cdot, \cdot)$をうまく選べたとする。

モーメント法ではこの条件を解いて$\theta$を求めることでパラメータを推定する。

標本$X_1,\cdots,X_n$が得られたとき、$\theta_j$のモーメント推定量$\hat{\theta}$は

$$
\frac{1}{n} \sum_{i=1}^n m_k (X_i ; \hat{\theta})=0
$$

により定義される。

大数の法則により標本モーメントは母集団モーメントに確率収束する、すなわち

$$
\frac{1}{n} \sum_{i=1}^n m_k (X_i ; \hat{\theta})
\xrightarrow{p} \mathrm{E}[m_k (X, \theta) ]
$$

のため標本モーメントを用いる。

:::{admonition} 例：平均と分散

正規分布$N(\mu, \sigma^2)$から無作為抽出された標本の平均と分散を求めたいとする。

原点のまわりの1次と2次のモーメントは

$$
\begin{align}
E[X] &= \mu\\
E[X^2] &= \sigma^2 + \mu^2
\end{align}
$$

であるため、モーメント条件を

$$
\begin{align}
E[m_1(X_i; \mu, \sigma^2)] &= E[X_i - \mu] = 0\\
E[m_2(X_i; \mu, \sigma^2)] &= E[X_i - (\sigma^2 + \mu)]=0
\end{align}
$$

とおいて標本$X_1, X_2, \cdots, X_n$で推定することで平均と分散の推定量を得られる。

標本対応したモーメント条件

$$
\begin{aligned}
& \frac{1}{n} \sum_{i=1}^n (X_i - \hat{\mu}) = 0\\
& \frac{1}{n} \sum_{i=1}^n [X_i^2 - (\hat{\sigma}^2 + \hat{\mu}^2)] = 0
\end{aligned}
$$

を解くと

$$
\begin{aligned}
& \frac{1}{n} \sum_{i=1}^n (X_i - \hat{\mu}) = 0\\
& \to \frac{1}{n} \sum_{i=1}^n \hat{\mu} = \frac{1}{n} \sum_{i=1}^n X_i\\
& \to \hat{\mu} = \frac{1}{n} \sum_{i=1}^n X_i\\
\\
& \frac{1}{n} \sum_{i=1}^n [X_i^2 - (\hat{\sigma}^2 + \hat{\mu}^2)] = 0\\
& \to \frac{1}{n} \sum_{i=1}^n X_i^2 = \frac{1}{n} \sum_{i=1}^n \hat{\sigma}^2 + \frac{1}{n} \sum_{i=1}^n  \hat{\mu}^2\\
& \to \hat{\sigma}^2 
= \frac{1}{n} \sum_{i=1}^n X_i^2 - \hat{\mu}^2\\
\end{aligned}
$$

となり、標本平均・標本分散と一致する
:::

:::{margin} （参考）モーメント

$$
\begin{align}
E[X] &= \mu\\
E[X^2] &= \sigma^2 + \mu^2
\end{align}
$$
:::

:::{admonition} 例：線形回帰モデル


線形回帰モデル

$$
Y_i = X_i^T \beta + u_i
$$

のパラメータ$\beta$の推定を考える。ここで$X$と$\beta$は$(k \times 1)$ベクトルとする。$X$は誤差項と無相関$E[X_i u_i] = 0$であるとする。

このモデルから$k$本のモーメント条件が得られる

$$
E[X_i u_i] = E[X_i (Y_i - X_i^T \beta)] = 0
$$

行列表記では

$$
\frac{1}{n} e^T e
= \frac{1}{n} X^T (Y - X\beta) = 0
$$

となる。これを解くと

$$
\frac{1}{n} X^T Y = \frac{1}{n} X^T X\beta\\
\to \beta = (X^T X)^{-1}X^T Y
$$

と、最小二乗法の解と一致する
::

## 一般化モーメント法（GMM）

未知のパラメータの数$k$とモーメント条件の数$r$が等しい（$k = r$）場合、上記のようにモーメント法で推定が可能である。

しかし、$k > r$や$k < r$の場合はモーメント法ではパラメータをうまく推定できない。

**一般化モーメント法（generalized method of moment: GMM）** は$k < r$、すなわちモーメント条件のほうが多い場合でも推定できるようにした方法である。

モーメント条件のほうが多い場合、$r$本の条件式

$$
E[m(X, \theta)]
= E
\begin{bmatrix}
m_1(X, \theta)\\
\vdots\\
m_r(X, \theta)\\
\end{bmatrix}
$$

が全体的に0に近くなるように

$$
\min_\theta Q_n(\theta)
=
\left[\frac{1}{N} \sum_{i=1}^N m(X_i ; \theta)\right]^{T}
W
\left[\frac{1}{N} \sum_{i=1}^N m(X_i ; \theta)\right]
$$

となるように$\theta$を選ぶ。ここで$W$はウェイト行列（weight matrix）と呼ばれる。単に$W=I$とすることもできるが、うまくウェイトを用いることで推定精度を向上させることができる。

この方法は **最小距離推定** （minimum distance estimation）と呼ばれる広いクラスの推定法の中の特別な場合だと解釈できるが、計量経済学ではこの方法を最初に導入したHansen (1982) に倣って **一般化モーメント法** （generalized method of moment: GMM）と呼ぶ。


この最小化問題は

$$
\left[\frac{1}{N} \sum_{i=1}^N \frac{\partial m(X_i ; \tilde{\theta})}{\partial \theta^T} \right]^{T}
W
\left[\frac{1}{N} \sum_{i=1}^N m(X_i ; \tilde{\theta})\right]
= 0
$$

を解いて求める。


ただし、

$$
\frac{\partial m(X_i ; \tilde{\theta})}{\partial \theta^{\prime}}
= \left.
\frac{\partial m(X_i ; \theta)}{\partial \theta^{\prime}}
\right|_{\theta=\tilde{\theta}}
$$

である。


## 一般化モーメント法と最尤推定法

最尤推定量は対数尤度の導関数をスコア関数とした

$$
\mathbb{E}\left[
    \frac{\partial \log f(Y|X; \theta)}{\partial \theta}
\right]
= 0
$$

という直交条件の下でのGMM推定量と考えることができる。


GMM推定量では標本モーメント条件

$$
\frac{1}{n}\sum^n_{i=1}
\frac{\partial \log f(Y_i|X_i; \theta)}{\partial \theta}
= 0
$$

を解く。

最尤推定法では対数尤度関数の最大化において

$$
\sum^n_{i=1} \frac{\partial \log f(Y_i|X_i; \theta)}{\partial \theta}
= 0
$$

を解くため、GMM推定量と最尤推定量は一致する。

:::{card} 例：線形回帰モデル

線形回帰モデル

$$
y=X \beta+\boldsymbol{u},
\quad (\mathrm{E}[\boldsymbol{u}]=\mathbf{0}, \mathrm{V}[\boldsymbol{u}]=\sigma^2 \boldsymbol{I}_n)
$$

を考える（簡単のため$\sigma^2$は既知とする）

誤差が正規分布に従うと仮定して尤度関数を特定化する場合、

$$
L(\boldsymbol{\beta} ; \boldsymbol{y})=\prod_{i=1}^n f\left(y_i \mid \boldsymbol{X}_i ; \boldsymbol{\beta}\right)
=\prod_{i=1}^n \frac{1}{\sqrt{2 \pi} \sigma} \exp \left[-\frac{\left(y_i-\boldsymbol{X}_i^T \boldsymbol{\beta}\right)^2}{2 \sigma^2}\right]
$$

対数尤度の導関数をスコア関数とすると

$$
\boldsymbol{m}\left(y_i, \boldsymbol{X}_i ; \boldsymbol{\beta}\right)
=
\frac{\partial \log f\left(y_i \mid \boldsymbol{X}_i ; \boldsymbol{\beta}\right)}{\partial \boldsymbol{\beta}}
=\frac{\left(y_i-\boldsymbol{X}_i^T \boldsymbol{\beta}\right) \boldsymbol{X}_i}{\sigma^2}
$$

なので、この直交条件は$\mathrm{E}[\boldsymbol{u}_i \boldsymbol{X}_i]=\mathbf{0}$を意味する。

（※前述のように、この直交条件は$u_i$が正規分布に従うと仮定しなくても使えるし$\beta$の一致推定量を得られる）

このスコア関数の標本対応は

$$
\frac{1}{n} \sum^n_{i=1}
\frac{(y_i-\boldsymbol{X}_i^T \boldsymbol{\beta}) \boldsymbol{X}_i}{\sigma^2}
= \frac{1}{n \sigma^2} \boldsymbol{X}^T (y - \boldsymbol{X} \boldsymbol{\beta}) = 0
$$

であり、これを解くと$\beta = (X^T X)^{-1}X^T Y$となる
:::

## 参考文献

- 西山慶彦, 新谷元嗣, 川口大司, & 奥井亮. (2019). 計量計済学.
- 難波明生. (2015). 計量経済学講義.
- [補足資料 1：一般化モーメント法 (GMM) に関するノート](https://www.nippyo.co.jp/blogkeisemi/wp-content/uploads/sites/5/2021/07/Draft_Keisemi_Demand2_Appendix1_GMM_v3.pdf)
