# ARIMAモデル

ARIMAはAuto-Regressive Integrated Moving Average Modelの頭文字をとったもの。

このモデルは、次の3つの成分から構成される。

- AR (Auto-Regressive) component：自己回帰成分
- I (Integrated) component：和分成分
- MA (Moving Average) component：移動平均成分

I (Integrated) 成分で定常化を目指す。モデルを構築するというよりも、前処理と表現したほうがいい。この場合の前処理とは、過去との差分を取り**階差系列**を作ることである。

例えば、今日の売上と昨日の売上の差分を求め、その差分を新たな時系列データとする、ということ。その新たなデータを**階差系列**と呼ぶ。上昇傾向や下降傾向などのトレンドがなくなるまで、この前処理を繰り返す。多くの場合、1,２回で十分で、この繰り返し数を、**差分の階数d**で表現します。

時系列データは、過去の値に依存する場合がある。この場合は**自己相関がある**ということ。

例えば、今日の売上が1日前（1期前）と似たような値を取るケース。

AR (Auto-Regressive)で、自己相関をモデル化する。

AR (Auto-Regressive)でモデル化するとき、何期前（p）までのデータを用いるかを考えなくてはならない。それを**自己回帰パラメータp**と言う。

AR過程は**過去の自分の値そのものと自己相関を持つ確率過程**である。一期前の自分と相関を持つAR(1)過程は以下のように表される。

$y_{t} = \phi_{1}y_{t-1} + \epsilon_{t}$

AR過程の特徴

- $y_{t} = \phi_{1}y_{t-1}+\phi_{2}y_{t-2}+\dots\phi_{p}y_{t-p} + \epsilon_{t}$
- 自己相関は少しずつ減衰する
- p時点までと偏自己相関を持ち、p時点以降は０になる
- <span style="color: red; ">$| \phi | \lt 1$の時に定常となる。</span>

一番下の特徴はAR過程において重要で、AR過程の全ての係数ϕの絶対値を足した値が1より小さい時に限りAR過程は定常になる。

時系列データは、AR (Auto-Regressive)だけで自己相関を十分にモデル化できない。

自己相関は、**MA (Moving Average)**でもモデル化することができます。どこまでの過去を考慮するのかを考えなくてはならない。

それを**移動平均パラメータq**と言う。移動平均とは、残差の移動平均のことである。

MA過程は**過去の自分の誤差と相関を持つ確率過程**である。 一期前の自分と相関のあるMA過程をMA(1)とし、以下のように表される。

$y_{t} = \mu + \theta_{1}\epsilon_{t-1}+\epsilon_{t}$

$\epsilon$は正規ホワイトノイズと仮定することが多い。

MA(q)過程の特徴

- $y_{t} = \mu + \theta_{1}\epsilon_{t-1} + \theta_{2}\epsilon_{t-2} \dots \theta_{q}\epsilon_{t-q} + \epsilon_{t}$
- q時点までと自己相関を持ち、q時点以降は０になる
- 偏自己相関は少しずつ減衰する。

まとめ

ARIMAには3つのパラメーターがある。
- 自己回帰パラメータp
- 差分の階数d
- 移動平均パラメータq

どのようにパラメータ設定したかを明示的に示すために、**ARIMA(p,d,q)**という形式で表現する。
ARIMAモデルのパラメータは非負の整数（0,1,2...）の値をとり、このパラメータのことを**次数**と表現することも多い。

# SARIMAモデル

ARIMAは、季節性を効果的に捉えることができないという問題があり、この問題を解決するのが**SARIMA（Seasonal ARIMA）モデル**である。

SARIMAモデルのパラメータ
- 非季節性パラメータ（p,d,q）
- 季節性パラメータ (P, D, Q, m)

非季節性パラメータ（p,d,q）は、ARIMAモデルのパラメータと同じである。

- p：ARIMA の AR componentの次数（自己回帰パラメータ）と同じ
- d：ARIMA の I componentの次数（差分の階数）と同じ
- q：ARIMA の MA componentの次数（移動平均パラメータ）と同じ

ARIMAモデルと大きく異なるのは、以下の**季節性パラメータ (P, D, Q, m)**の存在である。

- m (Seasonal Period)：季節性の周期
- P (Seasonal AR component)：季節性の AR componentの次数
- D (Seasonal I component)：季節性の I componentの次数
- Q (Seasonal MA Component)：季節性のMA componentの次数

mは季節性の周期である。<br>
例えば、月単位の時系列データに対し12ヶ月周期がある場合、m=12 となる。

Pは、季節性のARcomponentの次数である。<br>
例えば、月単位の時系列データに対しm=12かつP=2の場合、12ヶ月前と24ヶ月前のデータの値を考慮するということ。

Dは、季節性の I componentの次数である。<br>
例えば、月単位の時系列データに対しm=12かつD=1の場合、12ヶ月前とデータとの差分をとるということ。

Qは、季節性のMA componentの次数である。<br>
例えば、月単位の時系列データに対しm=12かつQ=2の場合、12ヶ月前と24ヶ月前の残差を考慮するということ。

 

どのようにパラメータ設定したかを明示的に示すために、**SARIMA(p,d,q)(P, D, Q, m)**もしくは**SARIMA( p,d,q )( P,D,Q )[m]**という形式で表現します。