# Modelowanie szeregów  czasowych  z autokorelacją

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

#from ts_utils import check_time_series_stationary
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
from statsmodels.tsa.arima.model import ARIMA

In [None]:
from statsmodels.tsa.stattools import adfuller
def check_time_series_stationary(y, rolling_len = 12):
    
    y = pd.Series(y)
    
    df_test = adfuller(y)
    
    if df_test[1] < 0.05:
        print('Szereg jest stacjonarny')
    else:
        print('Szereg jest niestacjonarny')
    
    print("{0:^32s}".format("Dickey-Fuller Test"))
    print("-"*32+"\n")
    
    print("{0:<20s}: {1:>10.4f}".format('Test Statistic', df_test[0]))
    print("{0:<20s}: {1:>10.4f}".format('p-value', df_test[1]))
    print("-"*32+"\n")
    
    rolling_mean = y.rolling(rolling_len).mean()
    rolling_var = y.rolling(rolling_len).var()

    plt.plot(y)
    plt.plot(rolling_mean, label="Rolling mean")
    plt.plot(rolling_var, label="Rolling var")
    plt.legend()
    plt.show()
    
    print("{0:^32s}".format("Autocorrelation plot"))
    print("-"*32+"\n")
    pd.plotting.autocorrelation_plot(y)
    plt.show()

## Graficzna analiza przebiegu funkcji ACF i PACF

- jeśli autokorelacja próbkowa $\text{ACF}(h)$ znajduje się pomiędzy przedziałami ufności $\pm 1,96 \sqrt{n}$ dla $h > q$, to spodziewamy się, że dane są realizacją procesu $\text{MA}(q)$;
- jeśli cząstkowa autokorelacja próbkowa $\text{PACF}(h)$ znajduje się pomiędzy przedziałami ufności $\pm 1,96 \sqrt{n}$ dla $h > p$, to spodziewamy się, że dane są realizacją procesu $\text{AR}(p)$;

## Model średniej ruchomej - $\text{MA}(q)$

**Modelem średniej ruchomej rzędu $q$** nazywamy stacjonarny szereg $Y_t$ spełniający równanie:
$$Y_t = \mu+ \varepsilon_t + \sum_{i=1}^q \theta_i\cdot \varepsilon_{t-i},$$
gdzie $\theta_1, \theta_2, \ldots, \theta_{q}$ są współczynnikami modelu oraz $\varepsilon_t$ to biały szum.

## Zadanie - model MA(1)

Wygeneruj 100 elementowy szereg MA(1): $Y_t = \varepsilon_t + 0.9 \cdot \varepsilon_{t-1}$. Następnie sporządź wykresy ACF i PACF (`plot_acf` i `plot_pacf` z `statsmodels.graphics.tsaplots`).

In [None]:
# np.random.seed(128)
# N=  101
# e = np.random.normal(0,1,N)
# ma1 = np.array([e[i]+0.9*e[i-1] for i in range(1,N)])
# plt.plot(ma1)

In [None]:
# plot_acf(ma1,lags = 50,zero = False)
# plt.show()

In [None]:
# model_ma1 = ARIMA(endog = ma1,order=(0,0,1))
# model_ma1 = model_ma1.fit()
# #Y_t = \mu+eps_t+theta * eps_{t-1}

In [None]:
# model_ma1.summary()

In [None]:
# model_ma1 = ARIMA(endog = ma1,order=(0,0,1),trend='n')
# model_ma1 = model_ma1.fit()

In [None]:
# model_ma1.summary()

## Zadanie - model MA(2)
Wygeneruj 100 elementowy szereg MA(2): $Y_t = \varepsilon_t + 0.9 \cdot \varepsilon_{t-1} + 0.7 * \varepsilon_{t-2}$.

In [None]:
# np.random.seed(128)
# N=  102
# e = np.random.normal(0,1,N)
# ma2 = np.array([e[i]+0.9*e[i-1]+0.7*e[i-2] for i in range(1,N)])
# plt.plot(ma2)

## Model autoregresji rzędu $p$ - $\text{AR}(p)$

**Modelem autoregresji rzędu $p$** nazywamy stacjonarny szereg czasowy $Y_t$ spełniający równanie:
$$Y_t = \mu+\sum_{i=1}^p \phi_i\cdot Y_{t-i} + \varepsilon_t,$$
gdzie $\phi_1, \phi_2, \ldots, \phi_p$ są współczynnikami modelu oraz $\varepsilon_t$ to biały szum.

## Zadanie - model AR(1) 

Wygeneruj 100 elementowy szereg AR(1): $Y_t = 0.8\cdot Y_{t-1} + \varepsilon_t = 0.8\cdot (0.8\cdot Y_{t-2}+\varepsilon_{t-1})+\varepsilon_{t}$. Następnie sporządź wykresy ACF i PACF.

In [None]:
# #szereg z procesu AR(1), nie rozpatrujemy pierwszych 100 obserwacji, aby pozbyć się wpływu punktu początkowego (musimy od jakiegoś zacząć bo w teorii AR idzie od czsu t = -oo do t = oo)
# np.random.seed(128)
# N = 201
# e = np.random.normal(0,1,N)
# ar1 = np.zeros(N)
# for i in range(1,N):
#   ar1[i] = 0.8*ar1[i-1]+e[i]
# ar1 = ar1[101:]
# plt.plot(ar1)
# plt.show()

In [None]:
# plot_acf(ar1,lags = 50,zero = False)
# plt.show()

In [None]:
# plot_pacf(ar1,lags = 20,zero = False)
# plt.show()

In [None]:
# model_ar1 = ARIMA(endog = ar1,order=(1,0,0))
# model_ar1 = model_ar1.fit()

In [None]:
# model_ar1.summary()

In [None]:
# model_ar1 = ARIMA(endog = ar1,order=(1,0,0),trend='n')
# model_ar1 = model_ar1.fit()

In [None]:
# model_ar1.summary()

## Zadanie - model AR(2) 

Wygeneruj 100 elementowy szereg AR(2): $Y_t = 0.7\cdot Y_{t-2} + 0.8\cdot Y_{t-1} + \varepsilon_t$. Następnie sporządź wykresy ACF i PACF.

## Model autoregresji ruchomej średniej - $\text{ARMA}(p, q)$

**Modelem autoregresji ruchomej średniej** nazywamy stacjonarny szereg czasowy $Y_t$ spełniający równanie:
$$Y_t = \mu+\sum_{i=1}^p \phi_i\cdot Y_{t-i} + \sum_{j=1}^q \theta_j \cdot \varepsilon_{t-j} + \varepsilon_t,$$
gdzie $\phi_1, \phi_2, \ldots, \phi_p$ oraz  $\theta_1, \theta_2, \ldots, \theta_{q}$ są współczynnikami modelu oraz $\varepsilon_t$ to biały szum.

## Zadanie - model ARMA(1, 1)
Wygeneruj 100 elementowy szereg ARMA(1, 1): $Y_t = 0.7\cdot Y_{t-1} + 0.8\cdot \varepsilon_{t-1} + \varepsilon_t$. Następnie sporządź wykresy ACF i PACF.

In [None]:
# np.random.seed(129)
# N5 = 1001
# e = np.random.normal(0,1,N5)
# arma = 10*np.ones(N5)
# for i in range(1,N5):
#     arma[i] = 0.7*arma[i-1]+0.8*e[i-1]+e[i]
# arma = arma[101:]
# plt.plot(arma)
# plt.show()

In [None]:
# plot_acf(arma,lags = 50,zero = False)
# plt.show()

In [None]:
# plot_pacf(arma,lags = 20,zero = False)
# plt.show()

In [None]:
# model_arma = ARIMA(endog = arma,order=(0,0,8),trend='n')
# model_arma = model_arma.fit()

In [None]:
# model_arma.summary()

## Zadanie - model ARMA(2, 1)
Wygeneruj 100 elementowy szereg ARMA(2, 1): $Y_t = 0.5\cdot Y_{t-2} + 0.7\cdot Y_{t-1} + 0.8\cdot \varepsilon_{t-1} + \varepsilon_t$. Następnie sporządź wykresy ACF i PACF.

## Zadanie - szereg z trendem
Wygeneruj 100 elementowy szereg: $Y_t = t+0.7\cdot Y_{t-1} + 0.8\cdot \varepsilon_{t-1} + \varepsilon_t$. Następnie sporządź wykresy ACF i PACF.
Zamodeluj szereg na podstawie analizy ACF i PACF.

In [None]:
# np.random.seed(128)
# N5 = 201
# e = np.random.normal(0,1,N5)
# arima = 10*np.ones(N5)
# for i in range(1,N5):
#     arima[i] = i+0.7*arima[i-1]+0.8*e[i-1]+e[i]
# arima = arima[101:]
# plt.plot(arima)
# plt.show() #jest trend

In [None]:
# arima_diff = arima[1:]-arima[:(len(arima)-1)]
# plt.plot(arima_diff)

In [None]:
# plot_acf(arima_diff,lags = 50,zero = False)
# plt.show()

In [None]:
# plot_pacf(arima_diff,lags = 20,zero = False)
# plt.show()

In [None]:
# model_arima_diff = ARIMA(endog = arima_diff,order=(2,0,2))
# model_arima_diff = model_arima_diff.fit()

In [None]:
# model_arima_diff.summary()

In [None]:
# model_arima = ARIMA(endog = arima,order=(2,1,2),trend = 't')
# model_arima = model_arima.fit()

In [None]:
# model_arima.summary()

## Zadanie - szereg z sezonem i trendem
Wygeneruj 100 elementowy szereg: $Y_t = t+t$	mod $12 +0.7\cdot Y_{t-1} + 0.8\cdot \varepsilon_{t-1} + \varepsilon_t$.
gdzie $t$ mod $12$ oznacza dzielenie modulo (resztę z dzielenia) $t$ przez $12$.
Następnie sporządź wykresy ACF i PACF.
Zamodeluj szereg na podstawie analizy ACF i PACF.

In [None]:
# np.random.seed(128)
# N5 = 201
# e = np.random.normal(0,1,N5)
# arima = 10*np.ones(N5)
# for i in range(1,N5):
#     arima[i] = i+i%12+0.7*arima[i-1]+0.8*e[i-1]+e[i]
# arima = arima[101:]
# plt.plot(arima)
# plt.show() #jest trend i sezonowość

In [None]:
# #różnicujemy w celu pozbycia się trendu
# arima_diff = arima[1:]-arima[:(len(arima)-1)]
# plt.plot(arima_diff)
# plt.show() #patrzymy na szereg zróżnicowany, ale jest sezonowość

In [None]:
# #różnicujemy o 12 celem pozbysia się sezonowości
# arima_diff_12 = arima_diff[12:]-arima_diff[:(len(arima_diff)-12)]
# plt.plot(arima_diff_12)
# plt.show() #jest stacjonarny

In [None]:
# #analiza pacfów i acfów
# plot_acf(arima_diff_12,lags = 20,zero = False)
# plot_pacf(arima_diff_12,lags = 20,zero = False)
# plt.show()

In [None]:
# m1 = ARIMA(endog=arima_diff_12, order=(4, 0, 2)).fit()

In [None]:
# from statsmodels.tsa.statespace.sarimax import SARIMAX
# m2 = SARIMAX(endog=arima, order=(4, 1, 2),seasonal_order = (0,1,0,12), trend='c').fit()

In [None]:
# m2.summary()

In [None]:
# m1.summary()