# Modelo AutoRegressivo

Utilizando modelo autoregressivo para modelar a série temporal

Utilizaremos uma série temporal do número de passageiros de uma linha de trem

* Importando biblitecas

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
import warnings
warnings.filterwarnings('ignore')

* Lendo arquivo CSV

In [None]:
dados = pd.read_csv('Passageiros.csv')

Exibindo cinco primeiras linhas

In [None]:
dados.head()

* Removendo coluna ID

In [None]:
dados = dados.drop('ID',axis=1)

* Definindo data como índice

In [None]:
dados['Datetime'] = pd.to_datetime(dados['Datetime'])
dados = dados.set_index('Datetime')

* Número de passageiros diário

In [None]:
dados =  dados.resample('D').sum()
dados = dados.dropna()

* Graficando série temporal

In [None]:
dados.plot()
plt.xticks(rotation=45)
plt.xlabel('Data')
plt.ylabel('Passageiros')
plt.tight_layout()

In [None]:
t_treino = dados[dados.index<'2014-06-01'].index.values
t_teste = dados[dados.index>='2014-06-01'].index.values
X_treino = dados[dados.index<'2014-06-01'].values
X_teste = dados[dados.index>='2014-06-01'].values

* Aplicando modelo autoregressivo

In [None]:
from statsmodels.tsa.ar_model import AutoReg

In [None]:
modelo = AutoReg(X_treino, 1)
resultado = modelo.fit()
print(resultado.summary())

* Coeficientes

In [None]:
print('Coefficients: %s' % resultado.params)

* AIC

In [None]:
AIC = resultado.aic

In [None]:
print("AIC = {:0.2f}".format(AIC))

* Fazendo predições

In [None]:
X_pred = resultado.predict(start=len(X_treino), end=len(X_treino)+len(X_teste)-1)

* Calculando erros

In [None]:
plt.plot(t_treino,X_treino)
plt.plot(t_teste,X_teste)
plt.plot(t_teste,X_pred)
plt.xticks(rotation=45)

* Calculando erros

In [None]:
from sklearn.metrics import mean_squared_error

In [None]:
MSE = mean_squared_error(X_teste,X_pred)

In [None]:
RMSE = np.sqrt(MSE)

In [None]:
print("RMSE = {:0.2f}".format(RMSE))

* Grid Search

In [None]:
for i in range(1,20):
    modelo = AutoReg(X_treino, i)
    resultado = modelo.fit()
    AIC = resultado.aic
    X_pred = resultado.predict(start=len(X_treino), end=len(X_treino)+len(X_teste)-1)
    MSE = mean_squared_error(X_teste,X_pred)
    RMSE = np.sqrt(MSE)
    print("i = {} AIC = {:0.2f} RMSE = {:0.2f}".format(i, AIC,RMSE))

* Indíce igual a 14 apresentou melhor resultado

In [None]:
modelo = AutoReg(X_treino, 14)
resultado = modelo.fit()
X_pred = resultado.predict(start=len(X_treino), end=len(X_treino)+len(X_teste)-1)

In [None]:
plt.plot(t_treino,X_treino)
plt.plot(t_teste,X_teste)
plt.plot(t_teste,X_pred)
plt.xticks(rotation=45)