In [1]:
import numpy as np
import pandas as pd

import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns

# 日本語フォントを設定
font = {'family': 'IPAexGothic'}
mpl.rc('font', **font)

%matplotlib inline

# ARMAモデル

## 自己回帰移動平均モデル(AutoRegressive Moving Average model, ARMAモデル)

時系列$y_{n}$を過去の観測値$y_{n - i}$と白色雑音の現在および過去の値の線形和で表現したモデル

$$
y_{n} = \sum _{i=1}^{m}{ a_{i} y_{n - i} } + {\upsilon}_{n} - \sum _{i=1}^{\ell}{ b_{i} {\upsilon}_{n - i} }
$$

 - $m$ : 自己回帰の次数(order)
 - $a_{i}$ : 自己回帰係数(AR coefficient)
 - $\ell$ : 移動平均の次数
 - $b_{i}$ : 移動平均係数(MA coefficient)

ARMAモデルに従う時系列$y_{n}$はARMA過程と呼ばれる。

## 白色雑音

${\upsilon}_{n}$は平均0、分散${\sigma}^{2}$の正規分布に従う<strong>白色雑音</strong>で、時系列の過去$y_{n - i}$と独立と仮定する。

$$
\begin{eqnarray}
\mathrm {E}\left( {\upsilon}_{n} \right) & = & 0 \\
\mathrm {Var}\left( {\upsilon}_{n} \right) & = & {\sigma}^{2} \\
\mathrm {E}\left( {\upsilon}_{n} {\upsilon}_{m} \right) & = & 0 \quad n \neq m \\
\mathrm {E}\left( {\upsilon}_{n} y_{m} \right) & = & 0 \quad n > m
\end{eqnarray}
$$

## ARモデルとMAモデル

### 自己回帰モデル(AutoRegressive model, ARモデル)
実用上は$\ell = 0$と仮定し、時系列をその過去の値と白色雑音$\upsilon_{n}$だけで表現したモデルが最も重要である。

$$
y_{n} = \sum _{i = 1}^{m}{ a_{i} y_{n - i} } + {\upsilon}_{n}
$$

定常時系列解析のかなりの部分がARモデルだけを用いて実現できることに注意する必要がある。

### 移動平均モデル(Moving Average model, MAモデル)
$m = 0$とおくと$\ell$次の移動平均モデルが得られる。

$$
y_{n} = {\upsilon}_{n} - \sum _{i=1}^{\ell}{ b_{i} {\upsilon}_{n - i} }
$$

---

# インパルス応答関数

$By_{n} \equiv y_{n - 1}$によって定義される<strong>時間シフトオペレータ</strong>(lag operator)$B$を用いると、ARMAモデルを以下のように表せる。

時間シフトオペレータの定義より、$y_{n - i} \equiv By_{n - i + 1} = B(By_{n - i + 2}) = B^{2}(By_{n - i + 3}) = \cdots = B^{i - 1}(By_{n - i + i}) = B^{i}y_{n}$と表せられる。よって、

$$
\begin{eqnarray}
y_{n} & = & \sum _{i=1}^{m}{ a_{i} y_{n - i} } + {\upsilon}_{n} - \sum _{i=1}^{\ell}{ b_{i} {\upsilon}_{n - i} } \\
& = & \sum _{i=1}^{m}{ a_{i} B^{i} y_{n} } + {\upsilon}_{n} - \sum _{i=1}^{\ell}{ b_{i} B^{i} {\upsilon}_{n} } \\
& = & y_{n} \sum _{i=1}^{m}{ a_{i} B^{i} } + {\upsilon}_{n} - {\upsilon}_{n} \sum _{i=1}^{\ell}{ b_{i} B^{i} } \\
y_{n} - y_{n} \sum _{i=1}^{m}{ a_{i} B^{i} } & = & {\upsilon}_{n} - {\upsilon}_{n} \sum _{i=1}^{\ell}{ b_{i} B^{i} } \\
\left(1 - \sum _{i=1}^{m}{ a_{i} B^{i} }\right)y_{n} & = & \left(1 - \sum _{i=1}^{\ell}{ b_{i} B^{i} } \right){\upsilon}_{n}
\end{eqnarray}
$$
が導出できる。ここで、さらにARオペレータとMAオペレータをそれぞれ

$$
a\left(B\right) \equiv \left(1 - \sum _{i=1}^{m}{ a_{i} B^{i} }\right), \quad b\left(B\right) \equiv \left(1 - \sum _{i=1}^{\ell}{ b_{i} B^{i} } \right)
$$

によって定義すると、ARMAモデルは

$$
a\left(B\right)y_{n} = b\left(B\right){\upsilon}_{n}
$$

と簡潔に表すことができる。

上式の両辺を$a\left(B\right)$で割ると、ARMAモデルは$y_{n} = {a\left( B \right)}^{-1} b\left( B \right) {\upsilon}_{n}$と表現できる。したがって、形式的に得られる無限級数

$$
\mathrm {TODO : 証明}\\
g\left(B\right) \equiv {a\left(B\right)}^{-1} b\left(B\right) = \sum _{i=0}^{\infty}{ g_{i} {B}^{i} }
$$

によって、$g\left(B\right)$を定義すると、ARMAモデルに従う時系列$y_{n}$は、現在までに加わった白色雑音${\upsilon}_{n}$だけを用いて

$$
y_{n} = g\left(B\right) {\upsilon}_{n} = \sum _{i=0}^{\infty}{ g_{i} {\upsilon}_{n - i} }
$$

と無限次の移動平均モデルで表現できる。

$\left\{ g_{i} ; i = 0,1,\cdots \right\}$は時刻$n = 0$に加わったノイズが$i$期後に時系列に及ぼす影響の大きさを表しており、ARMAモデルの<strong style="color:blue;">インパルス応答関数</strong>(impulse response function)と呼ばれる。

$g_{i}$は

$$
\begin{eqnarray}
g_{0} & = & 1 \\
g_{i} & = & \sum _{j=1}^{i}{ a_{j} g_{i - j} - b_{i} } \quad (i = 1,2,\dots)
\end{eqnarray}
$$

によって計算できる。ただし、$j > m$のとき$a_{j} = 0, j > \ell$のとき$b_{j} = 0$とおくものとする。

---

# 自己共分散関数