# 時系列のモデリング

## 線形動的システム（周波数領域）を用いた時系列のモデリング

![alt text](picture/fig1.png)

ある時系列は平均値0,分散1の世紀性白色雑音v(k)がなんらかの線形離散時間動的システム<br>
を通って得られたものであるとしてモデリングできる


$y(k) = H(z)v(k)$

z:時間推移演算子<br>
たとえば$zy(k) = y(k+1)$となるような演算子<br>
<br>
周波数領域で考えると、白色雑音のパワースペクトル密度関数は周波数に対して一定であるから、<br>
ある周波数特性を持つシステム$H$を通ると、時系列$y(k)$のパワースペクトル密度は、システムの周波数特性と同じ情報を持つ<br>
つまり時系列の動特性を解析することは、システムを解析することに等しい



### ARMAモデル（要点のみ）

２つの1次多項式を定義したとき、<br><br>
$A(e^{j\omega})=1+ae^{j\omega}$<br>
$B(e^{j\omega})=1+be^{j\omega}$<br>
<br>
$z=e^{j\omega}$とすると、<br>
<br>
$y(k) = \frac{B(z^{-1} )}{A(z^{-1} )}v(k)$<br>
<br>
このようなモデルをARMAモデル(自己回帰・移動平均モデル)という<br>
<br>
さらに式変形すると、<br>
$y(k) + ay(k-1) = v(k) + bv(k-1)$<br>
の確率差分方程式が得られる<br>

#### 微分方程式と差分方程式

連続時間の場合には微分方程式<br>
離散時間の時系列の場合には差分方程式で記述される

#### ARMAモデルの抽象化

確率過程のパワースペクトル密度関数が有理系（分数で与えられる形）で与えられれば、<br>
因数分解(ここではスペクトル分解)によって<br>
その確率過程を記述する差分方程式を導出している

#### 表現定理

有理系スペクトル密度関数$\phi(\omega)$が与えられたとき、<br>
入力が白色雑音で線形・漸近安定・最小位相・動的システムの出力が<br>スペクトル密度関数$\phi(\omega)$
となるような定常過程を与えるシステムが存在する<br>
いいかえると、すべての定常確率過程は白色雑音を安定・最小位相フィルタを通すことによって生成される<br><br>
この定理は時系列{$y(k)$}を有限個のパラメータで表現される線形システムというパラメトリックモデルで<br>
等価表現できることを示しており、時系列モデリングに基づく状態推定（フィルタリング）の基礎となる

### ARモデル(要点のみ)

システムHが分母だけのときARモデル(自己回帰モデル)という<br><br>
$y(k) = \frac{1}{A(z^{-1} )}v(k)$<br>
<br>
ARモデルは白色雑音過程が分母だけからなるフィルタを通って時系列が生成される<br>
分母は<u>極</u>に対応するため、極の情報の支配的な時系列（音声信号、地震波のような振動（共振）特性を有する時系列）<br>
のモデリングに適している

#### 自己回帰モデル

ARモデルを記述する差分方程式は<br><br>
$(1+a_1z^{-1})y(k) = v(k)$  <br>
→     $y(k) = -a_1y(k-1)+v(k) $<br><br>
現時刻kでの時系列の値y(k)は1時刻前の自分自身の値を用いて計算されている<br>
このことから自己回帰モデルと名付けられている<br><br>
測定された時系列データから{$y(1),y(2),...,y(k)$}からARモデルの係数{$a_1,a_2,...$}を<br>
推定する問題は時系列モデリングの中心テーマである<br>
これを<u>ARモデルへのフィッティング</u>という

### MAモデル（移動平均モデル）

システムHが分子だけのときMAモデル(移動平均モデル)という<br><br>
$y(k) = B(z^{-1} )v(k)$<br>
<br>
MAモデルは白色雑音過程が零点だけから構成される<u>FIRモデル(有限インパルス応答モデル)</u><br>
を通って時系列が生成される構造をしている<br>
MAモデルは有限個のインパルス応答から構成されるため、<br>
上記式の入出力関係は安定となり、時系列$y(k)$が発散することはない

#### 移動平均モデル

多項式$B(z^{-1}) = 0.5 + 0.5z^{-1}$<br>
とおいたMAモデルを考える<br><br>
この差分方程式は<br><br>
$y(k) = \frac{v(k) + v(k-1)}{2}$<br><br>
これは長さ2の移動平均フィルタを記述している<br>
このように移動平均の操作と関係しているため移動平均モデルと名付けられた

#### 移動平均

時系列データから、ある一定区間単位の平均値を、時系列をずらしながら取得するもの<br>
平滑化の技法

### ARIMAモデル(自己回帰・積分・移動平均モデル)

非定常時系列を記述するモデル<br><br>
$A(z^{-1})\nabla^dy(k) = B(z^{-1})v(k)$<br><br>
ただし$\nabla^d$は以下に定義される差分演算子<br>
$\nabla^d = (1-z^{-1})^d, d=0,1,2 $

![alt text](picture/fig2.png "Title")

確率差分方程式は計算すると以下のようになる<br><br>
$\nabla y(k) = -a_1\nabla y(k-1) + b_0v(k) + b_1v(k-1) $ <br><br>
ちなみにd=0のときARIMAはARMAモデルに一致する<br>
<br>
このように、ARIMAモデルは時系列モデルにd個の積分器を含むため、<br>
非定常時系列を記述することができる<br>


## 時系列の状態空間モデル

### 状態空間モデル

ARMAモデルを説明したものの、実際には時系列データy(k)の観測値には雑音が混入している<br>
伝達関数により記述されたARMAモデルなどの時系列モデルを状態空間表現に転換し、観測雑音を考慮したモデルを考える<Br>
次の二点をまとめて時系列の状態空間表現である

#### 離散時間状態方程式

$x(k+1) = Ax(k) + bv(k)$<br><br>
$x(k)$は時刻kにおける状態でありn次元ベクトル<br>
状態とは時系列のふるまいを唯一に決定するために必要な最小のデータ<br>
あるいは時系列の未来のふるまいを予測するために必要な、時系列の過去のふるまいに関する最小のデータ<br>
<br>
$A$ : システム行列,大きさ(n×n),固有値は単位円ないにすべて存在<br>
$b$ : n次元ベクトル<br>
$v(k)$ : システム雑音,正規性白色雑音<br>



#### 観測方程式

$y(k) = c^Tx(k) + dv(k) + w(k)$<br>
<br>
$c$ : 観測係数ベクトル,n次元,物理量から観測量への変換係数ベクトル,たとえば熱電対から温度を測るとき温度と電圧の変換に用いる<br>
$w(k)$ : 観測雑音,システム雑音と無相関な正規性白色雑音が仮定される<br>
$dv(k)$ : 直達項,時間送れなく直接d倍されてy(k)に影響する項
<br><br>
ちなみに正規性の雑音であるということは、振幅の分布が正規分布に従うことを示す

### 状態空間モデルからARMAモデルへの変換

$H(z) = c^T(zI - A)^{-1}b + d$<br><br>
$y(z) = H(z)v(z) + w(z)$<br><bR>
というわけで、状態空間表現は伝達関数表現に観測雑音を考慮したものに等しい

### 状態空間モデルの実現

#### 可観測正準系(省略)

#### 可制御正準系(省略)

 ## 測定データ（時間領域）に基づく時系列モデリング

時系列のパワースペクトル密度関数をスペクトル分解することによりARMAモデルを構築したが、<br>
実データに適用した場合、定常性を満たすようなデータを十分多く利用できるか、スペクトル分解が行えるか、など<br>
困難な課題が多いため、時間領域における時系列モデリング法が必要になる<br><br>

![alt text](picture/fig3.png "fig3")

<br><br>
おそらくだけど、周波数領域における話は伝達関数になおしてスペクトル分解を行うことにより、<br>
確率差分方程式の係数（パラメタ）を決定していた。だけど実データではいつでもそれができるとが限らないので、<br>
ARMAモデルやARモデルなどについて、最小二乗推定法などを用いて直接パラメタを求められるよって話だと思う<br>

### ARモデルを用いた同定

時系列データ{$y(k)$}が測定されたとき、そのデータに基づいてARモデルのパラメータ{$a_i$}を推定する問題、<br>
すなわりARモデルを用いた時系列モデリングについて考える

$y(k) = -a_1y(k-1)-a_2y(k-2)-...-a_ny(k-n)+v(k), k=1,2,...,N $<br><br>
で記述されるn次ARモデルのパラメータ推定問題について説明する<br><br>
$y(k) = \theta^T\phi(k) + v(k)$<br>
<br>
$\theta = [a_1,a_2,...a_n]^T$ :     推定すべき未知パラメータベクトル<br>
$\phi(k) = [-y(k-1)-y(k-2)-...-y(k-n)]^T$ : 回帰ベクトル<br><br>
<u>ARモデルでは未知パラメータに関して線形な系(1次系)で時系列y(k)を記述できる</u>

#### 最小二乗推定法

$J_N = \frac{1}{N}\sum^N_{k=1}(y(k)-\hat{\theta}^T\phi(k))^2$<br><br>

パラメータ推定のための評価関数としては最小二乗推定法を用いる<br>
これを最小にする$\hat{\theta}$を求める<br><br>

なんやかんや計算すると以下のように求まる<br><br>
$\hat{\theta} = \begin{pmatrix}\hat{a_1}  \\\hat{a_2}  \end{pmatrix} =-\begin{pmatrix}\phi_y(0) & \phi_y(1)  \\\phi_y(1) & \phi_y(0) \end{pmatrix}^{-1} \begin{pmatrix}\phi_y(1)  \\ \phi_y(2)  \end{pmatrix}$
<br><br>
以上のように、時系列データが観測されたら、自己相関関数$\phi_y(\tau)$を計算し、その値を用いて伝達関数モデルである<br>
ARモデルの係数を推定することができる<br><br>

$G = \begin{pmatrix}\phi_y(0) & \phi_y(1)  \\\phi_y(1) & \phi_y(0) \end{pmatrix}$<br><br>
は規則的な並び方をしていて、
テプリッツ行列と呼ばれる<br>

### ARMAモデルを用いた同定(式省略)

ARモデルの場合は未知パラメータに対して線形であったため、推定値を線形方程式を解くことにより求めた<br>
ARMAは未知パラメータに対して非線形な関係となるため、<br>
パラメータ推定問題は非線形最適化問題になる<br><br>
ARMAの場合、回帰ベクトルに過去の白色雑音の値v(k-1),v(k-2)が含まれている<br>
これらは測定可能な量ではないため、ARモデルに比べて複雑になる

### 状態空間モデルを用いた同定

時系列の状態空間モデル<br><br>
$x(k+1) = Ax(k) + bv(k)$<br>
$y(k) = c^Tx(k) + dv(k) + w(k)$<br><br>
のパラメータ行列・ベクトル$(A,b,c)$を推定する問題、すなわち状態空間モデルを用いた同定問題を考える<br>
最も有力な同定法は<u>部分空間同定法</u>である<br>
手順をまとめるとこんな感じ<br>
1. 時系列データ{y(k)}から自己共分散関数（その時系列の平均値が0であれば、自己相関関数と同じ）を計算
2. 自己共分散行列を要素としてもつハンケル行列を構成する
3. ハンケル行列を特異値分解し、その特異値の大きさを参考にして、時系列の次数を決定する
4. シフト不変性や最小二乗推定法を用いて、システム行列(A,b,c)を計算する