   # 定常性、ARMA・ARIMAモデル

- **[2.1 定常性](#2.1-)**
    - **[2.1.1 定常性とは](#2.1.1-)**
    - **[2.1.2 弱定常性・強定常性](#2.1.2-)**
    - **[2.1.3 ホワイトノイズ](#2.1.3-)**
<br><br>
- **[2.2 定常性の確認](#3.2-)**
    - **[2.2.1 なぜ定常性が重要なのか](#3.2.1-)**
    - **[2.2.2 定常性の確認(視覚化)](#3.2.2-)**
    - **[2.2.3 時系列データを非定常にしているもの](#3.2.3-)**
<br><br>
- **[2.3 ARMA・ARIMAモデル](#2.2-)**
    - **[2.3.1 ARMAモデルとは](#2.2.1-)**
    - **[2.3.2 MAモデル](#2.2.2-)**
    - **[2.3.3 ARモデル](#2.2.3-)**
    - **[2.3.4 ARMAモデル](#2.2.4-)**
    - **[2.3.5 ARIMAモデル](#2.2.5-)**
<br><br>
- **[2.3 添削問題](#2.3-添削問題)**

## 2.1 定常性

### 2.1.1 定常性とは

時系列分析においてとても重要な概念が **<font color=#AA0000>定常性</font>** です。時間や位置によってその確率分布が変化しないという確率過程の性質を表します。わかりやすく述べると

**時間の経過によらず一定の値を軸に**

**同程度の幅で振れて変化する**

時系列データは定常性があるといえます。
この後も数式がたくさん出て来ますが、時系列解析入門では数式そのものよりもその **数式が意味すること** と **グラフの形状** について注目して理解していきましょう。

#### 問題

- 次の[ ]に当てはまる文を選んでください。
- 定常性がある時系列データは[ ]するデータである。

1. 時間の経過に伴って上昇する直線を軸とし、異なる幅で振れて変化する
1. 時間の経過に伴って上昇する直線を軸とし、同程度の幅で振れて変化する
1. 時間の経過によらず一定の値を軸とし、異なる幅で振れて変化する
1. 時間の経過によらず一定の値を軸とし、同程度の幅で振れて変化する

#### ヒント

- 何が一定で、何が変動するのか確認しましょう。

#### 解答

時間の経過によらず一定の値を軸とし、同程度の幅で振れて変化する

### 2.1.2 弱定常性・強定常性

定常性には **<font color=#AA0000>弱定常性</font>** と **<font color=#AA0000>強定常性</font>** の2つに分類されます。今後、時系列データ分析においては主に弱定常について扱うので単に定常性などという場合は弱定常を指すとお考えください。

弱定常は時系列データの**期待値と自己共分散が時間を通して一定**であるという意味です。 <br>
自己共分散とは今の自分からt時（時間）離れた自分との間の共分散、両者の間にどれくらいのばらつきがあるか、のことです。<br>

平均値を$\mu$,$k$次元の自己共分散を$\gamma_k$とすると

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5060_tsa/02_01.jpg">

と表わされます。**期待値が一定**ということは**時間の経過によらず一定の値を軸に変動している**ということを表し、**自己共分散が一定**ということは**データのばらつきが一定**ということですから**同程度の幅で振れて変化する**ということを表しています。

#### 問題

- 次の[ ]に入る言葉を答えてください
- 弱定常性は期待値と[ ]が時間を通して一定であるという意味である。

1. 相関係数
1. 自己共分散
1. 偏差値
1. トレンド

#### ヒント

弱定常の定義を確認してみましょう。

#### 解答

自己共分散

### 2.1.3 ホワイトノイズ

全ての時点 $t$ において

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5060_tsa/02_02.jpg">


が成り立つとき
このような時系列を **<font color=#AA0000>ホワイトノイズ</font>** といい、上記の定義に基づいた弱定常性を持ちます。上の式ははホワイトノイズ $\varepsilon_t$ の期待値がどの様な時点 $t$ であっても $0$ であることを表し、下の式はホワイトノイズの自己共分散が自分自身とでは $0$ でありそれ以外の$k$次では $s^2$ で一定となることを表しています。
**ホワイトノイズ**は時系列モデルにおける **不規則変動パターン** を担います。不規則変動自体は数学的な再現が難しいため、**ホワイトノイズ**を用いるのです。

#### 問題

- ホワイトノイズを出力してどのような時系列データであるかを確認しましょう。次のコードを実行してみてください

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import numpy as np
from pandas import datetime
%matplotlib inline

#ホワイトノイズの設定
mean = 0
std = 1 
num_samples = 1000
samples = np.random.normal(mean, std, size=num_samples)
# ホワイトノイズのプロット
plt.title("Whitenoise")
plt.plot(samples)
plt.show()
# 何も書き込まずに実行してください

#### ヒント

- `mean=0`が$E(\varepsilon_t) = 0$
- `sted=1`が$\gamma_k = s^2 (= 1)$を表します。 

#### 解答例

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import numpy as np
from pandas import datetime
%matplotlib inline

#ホワイトノイズの設定
mean = 0
std = 1 
num_samples = 1000
samples = np.random.normal(mean, std, size=num_samples)
# ホワイトノイズのプロット
plt.title("Whitenoise")
plt.plot(samples)
plt.show()
# 何も書き込まずに実行してください

***

## 2.2 定常性の確認

### 2.2.1 なぜ定常性が重要なのか

　前チャプターで定常性について学びましたが、なぜ **定常性** が重要なのでしょうか。それは、時系列データにおいては定常性がないデータを分析した結果全く意味のない相関(Aが上がればBも上がる、もしくは下がるという関係)を検出してしまう可能性があるからです。時系列データとは時間の経過に沿って変化するデータですから、 **「時間の経過」という共通項目** が無意味な相関関係を産んでしまうのです。(このような無意味な相関のことを **擬似相関** といいます)
　
 
 例を挙げましょう、私が生まれたのは1994年なのですが、それから20になるまでの20年間私の体重は増え続けています。一方で近年発展の目覚ましい中国のGDPも1994年頃から20年間伸び続けています。このとき、「中国のGDPが伸びたのは私の体重が増えたからだ」というのはナンセンスでしょう。
 
 このような **時系列データの無意味な相関を検出しないため** に、定常性のない時系列は階差をとる等の変換を行い定常性のある時系列にしてから分析を進める必要があるのです。

#### 問題

- 時系列データにおいて、定常性のないデータを分析してしまうとなぜいけないのでしょうか

1. 階差が生じてしまうため
1. 擬似相関が生じてしまうため
1. トレンドが生じてしまうため

#### ヒント

- 擬似相関とは全く無意味な相関のことです。

#### 解答

擬似相関が生じてしまうため

### 2.2.2 定常性の確認 (視覚化)

　ある時系列が定常であるかどうか確認するための最も有効な方法は実際に観察することです。コースの冒頭でも述べたようにデータの視覚化は時系列分析、もっと言えばデータ分析の基本です。先程も述べたように定常性のある時系列データには

**時間の経過によらず一定の値を軸に**

**同程度の幅で振れて変化する**

という特徴があります。

#### 問題

- ホワイトノイズを可視化して定常性がありそうか確認してみましょう。次のコードを実行してください。

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import numpy as np
from pandas import datetime
%matplotlib inline

#ホワイトノイズの設定
mean = 0
std = 1 
num_samples = 1000
samples = np.random.normal(mean, std, size=num_samples)
# ホワイトノイズのプロット
plt.title("Whitenoise")
plt.plot(samples)
plt.show()
# 何も書き込まずに実行してください

#### ヒント

- ホワイトノイズは **期待値と自己相関係数が一定の過程** です

#### 解答例

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import numpy as np
from pandas import datetime
%matplotlib inline

#ホワイトノイズの設定
mean = 0
std = 1 
num_samples = 1000
samples = np.random.normal(mean, std, size=num_samples)
# ホワイトノイズのプロット
plt.title("Whitenoise")
plt.plot(samples)
plt.show()
# 何も書き込まずに実行してください

***

## 2.3 ARMA・ARIMAモデル

### 2.3.1 ARMAモデルとは

このコースでは、 **1変量の時系列データ** を分析するための基本的なモデル、 **<font color=#AA0000>ARMAモデル（アーマ）</font>** と **<font color=#AA0000>ARIMAモデル（アリマ）</font>** について学び、その発展形である **<font color=#AA0000>SARIMAモデル（サリマ）</font>** を用いて時系列データのモデリングをおこないます。

**ARMAモデル** とはその名前の通り後述する **ARモデル** と **MAモデル** をあわせたモデルになります。

**ARMAモデル** は **SARIMAモデル** だけでなくその他の発展的なモデルの基礎となっており非常に重要です。

#### 問題

- ARMAモデルはどの2つのモデルを組み合わせたデータでしょうか、次の選択肢から選んでください。

1. AR,I
1. AR, MA
1. VR, MA
1. I,MA

#### ヒント

- ARMAモデルは名前の表す通りのモデルです。 

#### 解答

AR, MA

### 2.3.2 MAモデル

 **<font color=##AA0000>MAモデル(移動平均モデル)</font>** はホワイトノイズを $\varepsilon_{t}$ として

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5060_tsa/02_03.jpg">

のように表されるモデルです。(1次過程の場合) <br>
ホワイトノイズとは

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5060_tsa/02_02.jpg">

を成り立たせる時系列のことでした。

このモデルは **ホワイトノイズ** を拡張したモデルです。一時点ずらした値と比べてみますと

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5060_tsa/02_04.jpg">

のように $\varepsilon_{t-1}$ が共通部分になるために、自己相関を持ちます。
そして、この **MAモデル** は**過去の誤差に影響されるモデル**であり、直前の $q$ 個の値の誤差の影響を受けるモデルを $MA(q)$ と表します。

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5060_tsa/02_05.jpg">

のように$MA(q)$モデルは$y_t$と$y_{t-1}$にq個の共通部分を持ちます。そのため

 **$q$期前までは自己相関をもち、$q+1$期前のデータとは自己相関を持たない** 
という性質を持ちます。



#### 問題

- 次の[ ]に入る言葉を答えてください
- MAモデルは過去の[　]に影響されるモデルであり、直前 $q$ 個の[　]の影響を受けるモデルを $MA(q)$ と表します。

1. 誤差
1. トレンド
1. 自己相関係数
1. 期待値

#### ヒント

- 過去のデータの誤差に影響されるのがMAモデルです。

#### 解答

誤差

### 2.3.3 ARモデル

**<font color=##AA0000>ARモデル(自己回帰モデル)</font>** は規則的に値が変化していくモデルで

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5060_tsa/02_06.jpg">

のように表されるモデルです。このように $y_t$ がそこから一時点ずらした $y_{t-1}$ で表されるためにそこに自己相関が表現されます。ARモデルは過去の値から回帰的にある時点の値を推定するモデルで、直前の $p$ 個の値を用いて次の値を予測するモデルを $AR(p)$ と表現します。

#### 問題

- 次の[　]を埋めてください。
- ARモデルは$y_t$が$y_{t-1}$で表されるために[　]が表現される。

In [None]:
1. 自己相関
1. 期待値
1. トレンド
1. 誤差

#### ヒント

- ARモデルは $y_t$ がそこから一次点ずらした $y_{t-1}$ で表されるためにそこに自己相関が表現されます。

#### 解答

自己相関

***

### 2.3.4 ARMAモデル

ARモデルとMAモデルは互いに競合する性質がありません。そのためこの2つを組み合わせて定式化することが可能です。AR(p)のARモデルとMA(q)のMAモデルを組み合わせたときARMA(p,q)のように表すことができます。

**ARモデルは過去の値から回帰的にある時点の値を推定するモデル**

**MAモデルは単に時系列が異なる式との間に共通部分を持つために相関性が存在するという性質のこと**

でしたね。

#### 問題

- [  ]に当てはまる言葉を埋めてください。
- ARモデルとMAモデルを組み合わせることができるのは[ ]からである。

1. 同じトレンドを有するため
1. 誤差が等しいため
1. お互いに競合する性質がないため
1. 同じ周期を持つため

#### ヒント

- ARモデルとMAモデルは互いに競合する性質がありません

#### 解答

お互いに競合する性質がないため

### 2.3.5 ARIMAモデル

先程のARMAモデルへ原系列を階差系列に変換し適応したものをARIMAモデルと言います。ARMAモデルは定常過程にしか適応できませんがARIMAモデルは非定常過程（データの平均や分散が時間に依存している過程）にも適応可能です。

d時点前との差分をとった場合のARMA(p,q)で構築したARIMAモデルをARIMA(p,d,q)と表します。
このARIMAモデルにおける


・$p$を**自己相関度**

・$d$を**誘導**

・$q$を **移動平均**

と呼びます。

#### 問題

- [ ]に入る言葉を埋めてください。
- 非定常過程の原系列の[ ]をとり、ARMAモデルを適応したモデルをARIMAモデルという。

1. 偏差値
1. トレンド
1. 相関
1. 差分

#### ヒント

- ARMAモデルへ原系列を階差系列に変換し適応したものをARIMAモデルと言います。

#### 解答

差分

***