 # 時系列分析の基礎知識

##  時系列データの種類
- 原系列
    - 加工していない生のデータ
    - 時系列分析の目的はほとんどの場合、原系列の性質を明らかにすることだが、
      原系列に何らかの処理を施した系列を扱うことが専ら


- 対数系列
    - 原系列に対数変換を施した系列
    - 対数変換する理由：<br>
      原系列では定常性の仮定が満たされない場合がある（例：値が大きくなるにつれてばらつきが大きくなる）が、<br>
      対数変換によってその問題が解消可能であることが多いから
      （定常性が満たされないとモデルへのフィッティングなど分析が難しいから定常性を満たすデータにしたがる？）


- 差分系列 / 階差系列
     - $\Delta y_t (= y_t - y_{t-1})$ の系列
     - 単位根過程に従ったデータの差分系列は定常過程となる


- 対数差分系列
    - 対数系列の差分系列
    - 通常の変化率 $\frac{y_t-y_{t-1}}{y_{t-1}}$ の代わりに用いられることが多い
        -　$\frac{y_t-y_{t-1}}{y_{t-1}}$　が微小だとすると、対数差分系列は以下のように近似可能なため
        - $\Delta logy_t = log\left(y_t\right) - log\left(y_{t-1}\right)= log\left(\frac{y_t}{y_{t-1}}\right) = log\left(1+\frac{y_t-y_{t-1}}{y_{t-1}}\right) \approx \frac{y_t-y_{t-1}}{y_{t-1}}$
        - 参考：マクローリン展開<br>
          $f(x) = f(0) + f'(x)x + \frac{f''(0)}{2!}x^2 + \cdots \approx f(0) + f'(0)x \quad {\rm if.}\ x \approx 0$


- 季節調節済み系列 / 季調済み系列 (seasonally adjusted series)
    - 原系列から季節変動を取り除いた系列
    - 季節的な変動を含むデータの場合、季節変動に起因しない変動の分析が容易になる

## 基本的な統計量
- 期待値 / 平均 $\mu_t$
- 分散 $\sigma^2_t$
    - 偏差の２乗の期待値
    - 平均からどの程度ばらつくかを表す
- 標準偏差 $\sigma_t$
    - 分散の平方根


- 自己共分散 (autocovariance)
    - 同一時系列データにおいて異なる時刻間の共分散
    - $k$ 次の自己共分散<br>
      $\gamma_{k,t}= E\left[\left(y_t - \mu_t\right)\left(y_{t-k} - \mu_{t-k}\right)\right]$
    - 大まかな性質
        - $\gamma_{k,t}>0$: $k$時刻離れた系列に似た変動をしている
        - $\gamma_{k,t}\approx0$: $k$時刻離れた系列とは何の相関もない
        - $\gamma_{k,t}>0$: $k$時刻離れた系列とは逆の変動をしている
        - $\gamma_{0,t} = \sigma^2_t$ とみなせる
    - 自己共分散関数
        - $k$ を変数とした関数で表す自己共分散
        
        
- 自己相関係数 (autocorrelation coefficient)
    - 自己共分散は系列のスケール（単位）に依存して変化するため、効果量の強弱を推し量ることができない問題を抱える
    - そのため自己共分散を規格化する統計量が必要になる→自己相関（係数）
    - $k$ 次の自己相関<br>
      $\rho_{k,t} = \frac{\gamma_{k,t}}{\sqrt{\sigma^2_t \sigma^2_{t-k}}}$
    - 大まかな性質
        - $\rho_{0,t} = 1$
        - $\left|\rho_{k,t}\right| \leq 1 \quad {\rm if.}\ k\geq0$
    - 自己相関関数
        - $k$ を変数とした関数で表す自己相関
    - コレログラム(correlogram)
        - 自己相関関数をグラフに描いたもの

## 時系列分析の基本的な考え方
- 問題点
    - ある時刻におけるデータの期待値や分散は推定が不可能
        - 時刻 $t$ におけるデータを複数観測することが不可能だから
- 時系列分析におけるアプローチ
    - 観測された時系列データ $\{y_t\}$ を確率変数列 $\{Y_t\}$ からのサンプリング結果と見なして、<br>
      確率変数列の生成過程に対して何らかの性質・構造を仮定する
    - このような確率変数列は確率過程 (stochastic process) / データ生成過程 (DGP, Data Generating Process)と呼ばれる
    - 確率過程の構造は時系列モデルと呼ばれる

## 定常性 (stationarity)

### 弱定常性 (weak stationarity)
- 共分散定常性 (covariance stationarity) とも呼ばれる
- 任意の $t, k$ に対して以下が成立
    - $\mu_{t} = \mu$（時不変）
    - $\gamma_{k,t} = E[(y_t - \mu)(y_{t-k} - \mu)] = \gamma_k$（時不変・$k$にのみ依存→$\gamma_k=\gamma_{-k}$が成立）
- 過程が弱定常の時，自己相関も時不変になる
    - $\rho_{k,t} = \frac{\gamma_{k,t}}{\sqrt{\sigma^2_t \sigma^2_{t-k}}} = \frac{\gamma_{k,t}}{\gamma_0} = \rho_k$
    
### 強定常性 (strict stationarity)
- 時系列の任意の時点から切り出す長さ $l$ の系列における同時分布が不変
    - $f(y_t, y_{t+1}, \cdots, y_{t+l}) = f(y_{t+k}, y_{t+k+1}, \cdots, y_{t+k+l})$

### 正規過程 (Gaussian process)
- 任意の $t, l$ に対して，$(y_t, y_{t+1}, \cdots, y_{t+l})'$ が多変量正規分布に従う過程
- 一般に，弱定常過程が強定常過程であるとは限らないが，<font color="red">正規過程は弱定常と強定常が同値</font>
    - 多変量正規分布は期待値と共分散により完全に決定されるから（弱定常正規過程は強定常）
    - 単に $y_t$ の周辺分布が正規分布に従うのみであれば，弱定常と強定常は同値と限らないので注意

## ホワイトノイズ

### iid系列
- iid (independently and identically distributed): 各時刻のデータが互いに独立でかつ同一の分布に従う
- 期待値が0のiid系列は、撹乱項 (innovation, disturbance term) として用いることが可能
    - 時系列モデルにおける確率的変動を表現する
    - ただ、独立性や同一分布性といった仮定は強すぎる制約であり、必ずしも分析に必要なものではない
    
### ホワイトノイズ (white noise)
- 撹乱項として用いることが可能でありながら、iid系列より仮定が弱い系列
- 全ての時刻 $t$ において以下が成立
\begin{eqnarray}
    & &E[\varepsilon_t]=0 \\
    & &\gamma_k=E[\varepsilon_t \varepsilon_{t-k}]=
        \begin{cases}
            \sigma^2, \quad k = 0 \\
            0, \quad k \neq 0 \\
        \end{cases}
\end{eqnarray}
- 性質
    - 全ての時刻で期待値が0
    - 全ての時刻で分散が一定
    - 自己相関を持たない

## 自己相関の検定
- 時系列データが自己相関をもつかどうかは時系列分析のしやすさの点で重要
- 定常性とエルゴート性（集合平均＝時間平均）を満たす場合は自己相関の推定値の計算が容易
    - 期待値の推定量：標本平均 $\bar{y}=\frac{1}{T} \sum_{t=1}^T y_t$
    - 自己共分散の推定量：標本自己共分散 $\bar{\gamma_k}=\frac{1}{T} \sum_{t=k+1}^T (y_t-\bar{y})(y_{t-k}-\bar{y}),\ k=0,1,2,\cdots$
    - 自己相関の推定量：標本自己相関係数 $\bar{\rho}_k=\frac{\bar{\gamma_k}}{\bar{\gamma_0}},\ k=1,2,3,\cdots$
- 標本自己相関係数を用いて検定を行うことが可能
    - 自己相関がないという帰無仮説が棄却されるかどうかで判断