# 2. ARMA 過程
## 2.1 ARMA 過程の性質
時系列データの基本となる自己回帰移動平均(ARMA: auto regressive moving average)モデルについて。ARMA 過程は AR 過程と MA 過程を組み合わせたモデル。

例えば1次の自己相関を持つ時系列データをモデル化することを考える。ひとつの方法は $y_t$ と $y_{t-1}$ のモデルに共通の成分を含ませるというもの。具体的には、
$$y_t = a + b$$
$$y_{t-1} = c + b$$
というモデル化を行えば、共通の $b$ によって $y_t$ と $y_{t-1}$ が相関を持つことをモデル化できる。これが MA モデル。

もうひとつの方法はもっと直接的で、 $y_t$ のモデルに $y_{t-1}$ を含めるもの。具体的には以下。
$$y_t = ay_{t-1} + b$$
これが AR モデルである。

## 2.1.1 MA 過程
MA 過程はホワイトノイズの線形和で表される。1次の MA 過程のモデル(MA(1) と表記)は以下。
$$y_t = \mu + \epsilon_t + \theta_1\epsilon_{t-1}$$
$$\epsilon_t \sim W.N.(\sigma^2)$$
$y_{t-1}$ のデータを作るときに使った $\epsilon_{t-1}$ の値を、重み $\theta_1$ をかけた上で加算している。$\epsilon$ は撹乱項と呼ばれる。

### MA 過程の期待値
$$E(y_t)
= E(\mu + \epsilon_t + \theta_1\epsilon_{t-1})
= E(\mu) + E(\epsilon_t) + E(\theta_1\epsilon_{t-1})
= \mu$$
$\epsilon$ はホワイトノイズなので、期待値は 0 であるため。

よって MA 過程の期待値は $\mu$ である。

### MA 過程の分散
$$\gamma_0
= Var(y_t)
= Var(\mu + \epsilon_t + \theta_1\epsilon_{t-1})$$

a が定数の時、$Var(X + a) = Var(X)$ なので

$$Var(\mu + \epsilon_t + \theta_1\epsilon_{t-1})
= Var(\epsilon_t + \theta_1\epsilon_{t-1})$$

分散について $Var(X,Y) = V(X) + V(Y) + 2Cov(X,Y)$ である。よって

$$Var(\epsilon_t + \theta_1\epsilon_{t-1})
= Var(\epsilon_t) + Var(\theta_1\epsilon_{t-1}) + 2Cov(\epsilon_t, \theta_1\epsilon_{t-1})$$

さらに分散について、a が定数の時 $Var(aX) = a^2Var(X)$ である。よって

$$Var(\epsilon_t) + Var(\theta_{t-1}\epsilon_{t-1}) + 2Cov(\epsilon_t, \theta_{t-1}\epsilon_{t-1})
= Var(\epsilon_t) + \theta_1^2Var(\epsilon_{t-1}) + 2Cov(\epsilon_t, \theta_1\epsilon_{t-1})$$

共分散について、$Cov(X,Y) = E((X - \overline{X})(Y - \overline{Y}))$ なので、$Cov(\epsilon_t, \theta_1\epsilon_{t-1}) = E((\epsilon_t - \overline{\epsilon_t})(\theta_1\epsilon_{t-1} - \overline{\theta_1\epsilon_{t-1}})) = \theta_1E((\epsilon_t - \overline{\epsilon_t})(\epsilon_{t-1} - \overline{\epsilon_{t-1}})) = \theta_1Cov(\epsilon_t, \theta_1\epsilon_{t-1})$ である。よって

$$Var(\epsilon_t) + \theta_1^2Var(\epsilon_{t-1}) + 2Cov(\epsilon_t, \theta_1\epsilon_{t-1})
= Var(\epsilon_t) + \theta_1^2Var(\epsilon_{t-1}) + 2\theta_1Cov(\epsilon_t, \epsilon_{t-1})$$

ここで $\epsilon$ はホワイトノイズなので $Cov(\epsilon_t, \epsilon_{t-1}) = 0$ である。よって

$$Var(\epsilon_t) + \theta_1^2Var(\epsilon_{t-1}) + 2\theta_1Cov(\epsilon_t, \epsilon_{t-1})
= Var(\epsilon_t) + \theta_1^2Var(\epsilon_{t-1})$$

$Var(\epsilon) = \sigma^2$ なので

$$Var(\epsilon_t) + \theta_1^2Var(\epsilon_{t-1})
= (1 + \theta_1^2)\sigma^2$$

よって MA(1) 過程の分散 $\gamma_0$ は $(1 + \theta_1^2)\sigma^2$ である。元々の分散 $\sigma^2$ よりも少し大きくなる。

*参考: https://mathtrain.jp/exvarcov*

### MA 過程の自己相関
MA 過程では $\theta$ の大きさによって自己相関が変化する。$\theta$ が大きくなると過去の値と同じような値を取る確率が高くなっていくので、$\theta$ が大きくなると自己相関も大きくなるはず。MA(1) 過程の自己相関を具体的に計算してみる。まず1次の自己共分散は

$$\gamma_1 = Cov(y_t, y_{t-1})
= Cov(\mu + \epsilon_t + \theta_1\epsilon_{t-1}, \mu + \epsilon_{t-1} + \theta_1\epsilon_{t-2})$$

共分散について、$Cov(X,Y) = E((X - \overline{X})(Y - \overline{Y}))$ なので、

$$Cov(\mu + \epsilon_t + \theta_1\epsilon_{t-1}, \mu + \epsilon_{t-1} + \theta_1\epsilon_{t-2})
= E((\mu + \epsilon_t + \theta_1\epsilon_{t-1} - \overline{(\mu + \epsilon_t + \theta_1\epsilon_{t-1})})(\mu + \epsilon_{t-1} + \theta_1\epsilon_{t-2} - \overline{(\mu + \epsilon_{t-1} + \theta_1\epsilon_{t-2})}))
= E((\mu + \epsilon_t + \theta_1\epsilon_{t-1} - \mu)(\mu + \epsilon_{t-1} + \theta_1\epsilon_{t-2} - \mu))
= E((\epsilon_t + \theta_1\epsilon_{t-1})(\epsilon_{t-1} + \theta_1\epsilon_{t-2}))
= E(\epsilon_t \epsilon_{t-1} + \epsilon_t \theta_1\epsilon_{t-2} + \theta_1\epsilon_{t-1} \epsilon_{t-1} + \theta_1\epsilon_{t-1} \theta_1\epsilon_{t-2})
= E(\epsilon_t \epsilon_{t-1} + \theta_1\epsilon_t\epsilon_{t-2} + \theta_1\epsilon_{t-1}^2 + \theta_1^2\epsilon_{t-1} \epsilon_{t-2})
= E(\epsilon_t \epsilon_{t-1}) + E(\theta_1\epsilon_t\epsilon_{t-2}) + E(\theta_1\epsilon_{t-1}^2) + E(\theta_1^2\epsilon_{t-1} \epsilon_{t-2})
$$

ここで $\epsilon$ がホワイトノイズの場合、$\gamma_k = E(\epsilon_t\epsilon_{t-k})$ は $k = 0$ のとき $\sigma^2$、 $k \neq 0$ のとき $0$ である。よって

$$E(\epsilon_t \epsilon_{t-1}) + E(\theta_1\epsilon_t\epsilon_{t-2}) + E(\theta_1\epsilon_{t-1}^2) + E(\theta_1^2\epsilon_{t-1} \epsilon_{t-2})
= E(\theta_1\epsilon_{t-1}^2)
= \theta_1 E(\epsilon_{t-1}^2)
= \theta_1 \sigma^2
$$

この結果、MA(1)過程の1次自己共分散 $\gamma_1 = \theta_1 \sigma^2$ である。1次の自己相関は

$$\rho
= \frac{\gamma_1}{\gamma_0}
= \frac{\theta_1 \sigma^2}{(1 + \theta_1^2)\sigma^2}
= \frac{\theta_1}{1 + \theta_1^2}
$$

となる。

### MA(1) 過程の2次以降の自己相関
$$\gamma_k
= Cov(y_t, t_{t-k})
= Cov(\mu + \epsilon_t + \theta_1\epsilon_{t-1}, \mu + \epsilon_{t-k} + \theta_1\epsilon_{t-k})
= E((\mu + \epsilon_t + \theta_1\epsilon_{t-1} - (\overline{\mu + \epsilon_t + \theta_1\epsilon_{t-1}}))(\mu + \epsilon_{t-k} + \theta_1\epsilon_{t-k} - (\overline{\mu + \epsilon_{t-k} + \theta_1\epsilon_{t-k}})))
= E((\epsilon_t + \theta_1\epsilon_{t-1})(\epsilon_{t-k} + \theta_1\epsilon_{t-k}))
= E(\epsilon_t\epsilon_{t-k} + \epsilon_t\theta_1\epsilon_{t-k} + \theta_1\epsilon_{t-1}\epsilon_{t-k} + \theta_1\epsilon_{t-1}\theta_1\epsilon_{t-k})
= E(\epsilon_t\epsilon_{t-k}) + E(\epsilon_t\theta_1\epsilon_{t-k}) + E(\theta_1\epsilon_{t-1}\epsilon_{t-k}) + E(\theta_1\epsilon_{t-1}\theta_1\epsilon_{t-k})
$$

$k \geqq 2$ なので、$\epsilon_t\epsilon_{t-k}$ と $\epsilon_{t-1}\epsilon_{t-k}$ はすべて 0 になる。

よって $\gamma_k = Cov(y_t, y_{t-k}) = 0$ である。

### MA 過程の定常性
以上の結果より、過程の期待値と自己共分散は時刻 t に依存しない(時刻の差 k にのみ依存する)ことがわかるので、MA(1) 過程は(パラメータの値に関わらず)定常である。

### MA(q) 過程とその性質
MA(1) 過程を自然に拡張し、MA(q) 過程を考える。式は以下。

$$y_t = \mu + \epsilon_t + \theta_1\epsilon_{t-1} + \theta_2\epsilon_{t-2} + \cdots + \theta_q\epsilon_{t-q}, \epsilon \sim W.N.(\sigma^2)$$

MA(1) と同じように、以下の性質が成り立つ。

#### 平均
$$E(y_t) = \mu$$

#### 分散
$$\gamma_0 = Var(y_t) = (1 + \theta_1^2 + \theta_2^2 + \cdots + \theta_q^2)\sigma^2$$

#### 自己共分散
- $1 \leq k \leq q $ のとき $$\gamma_k = (\theta_k + \theta_1\theta_{k+1} + \cdots \theta_{q-k}\theta_q)\sigma^2$$
- $k \geq q + 1$ のとき $$0$$

#### 定常性
MA 過程は常に定常である

#### 自己相関
- $1 \leq k \leq q $ のとき $$\rho_k = \frac{\theta_k + \theta_1\theta_{k+1} + \cdots + \theta_{q-k}\theta_q}{1 + \theta_1^2 + \theta_2^2 + \cdots + \theta_q^2}$$
- $k \geq q + 1$ のとき $$0$$

MA(q) 過程の q+ 1 次以降の自己相関は 0 になる。モデル化したい時系列データが MA 過程か AR 過程かを判定するときにヒントになる性質。

## 2.1.2 AR 過程
