# 状態空間モデルによる欠損値補完

ローカルレベルトレンドモデルによる欠損値補完

## データ
- N : 全区間のデータ数
- M : 観測データ数
- L : 欠損データ数
- Y : 観測データ
- missing_index : 欠損データのインデックス

## パラメータ
- mu : 状態
- sigma_mu : システムモデル分散
- sigma_Y : 観測モデル分散

## モデル
- $\mu_{t} \sim Normal(\mu_{t-1},\sigma_{\mu}) $

- $Y_{t} \sim Normal(\mu_{t},\sigma_{Y}) $

In [1]:
%matplotlib inline
import pystan
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = (20, 12)

In [14]:
stan_code = """
data {
    int N;
    int M;
    int L;
    vector[N] Y;
    int missing_index[L];
}

parameters {
    vector[N] mu;
    real<lower=0> s_mu;
    real<lower=0> s_Y;
}

model {
    int cnt;
    cnt = 1;
    
    mu[2:N] ~ normal(mu[1:(N-1)],s_mu);

    for(i in 1:N){
        if(missing_index[cnt] ==i){
            if(cnt < L)
                cnt = cnt + 1;
        }else{
            Y[i] ~ normal(mu[i],s_Y);
        }
    }
}

"""

In [None]:
x=list(range(18))
np.random.shuffle(x)

y=np.cumsum(np.random.normal(0,1,size=20))

stan_dat = {
    'N': 20,
    'M': 18,
    'L': 2,
    'Y': y,
    'missing_index' : [5,8]
}
fit = pystan.stan(model_code = stan_code, data = stan_dat, iter = 2500, chains = 4)

In [None]:
y=np.cumsum(np.random.normal(0,1,size=18))
s=np.empty(20)
N=20
M=18
L=2
missing_index=[3,5]