# Auto ARIMA

Esse notebook será essencialmente uma continuação do ARIMA da pasta do ```statsmodel```, e por isso usaremos a mesma base de dados como ponto de partida.

## Dados iniciais

In [1]:
from pandas import read_csv
from datetime import datetime

def conversor(data):
    return datetime.strptime(data, '%Y-%m')

df = read_csv('AirPassengers.csv',index_col = 'Month',parse_dates = ['Month'],date_parser = conversor)

SerieTemporal = df['#Passengers']

## ```auto_arima()```

Vimos anteriormente que é difícil acertar os valores de (p,d,q) para ajustar o modelo de previsão. Tendo em vista isso, podemos usar a classe ```auto_arima```. Para isso, importamos da seuinte maneira

In [3]:
from pmdarima.arima import auto_arima

Dentre os parâmetros que existem, destacamos

* ```y```: série temporal sobre a qual é feito previsões,
* ```m```: é o período em que a série completa um ciclo. Isso deve ser observado pelo usuário. Além disso, colocar valores diferentes de m pode gerar previsões BASTANTE distintas.
* ```seasonal```: (booleana) serve para "dizer" ao modelo se a série temporal é ou não sazonal 

In [4]:
modelo_auto = auto_arima(SerieTemporal, m = 12, seasonal = True)

Para ver um resumo de parâmetros calculados, usamos o seguinte método:

In [6]:
modelo_auto.summary()

0,1,2,3
Dep. Variable:,y,No. Observations:,144.0
Model:,"SARIMAX(2, 1, 1)x(0, 1, [], 12)",Log Likelihood,-504.923
Date:,"Tue, 11 Jan 2022",AIC,1017.847
Time:,10:26:49,BIC,1029.348
Sample:,0,HQIC,1022.52
,- 144,,
Covariance Type:,opg,,

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
ar.L1,0.5959,0.085,6.987,0.000,0.429,0.763
ar.L2,0.2143,0.091,2.343,0.019,0.035,0.394
ma.L1,-0.9819,0.038,-25.605,0.000,-1.057,-0.907
sigma2,129.3125,14.556,8.884,0.000,100.783,157.842

0,1,2,3
Ljung-Box (L1) (Q):,0.0,Jarque-Bera (JB):,7.68
Prob(Q):,0.98,Prob(JB):,0.02
Heteroskedasticity (H):,2.33,Skew:,-0.01
Prob(H) (two-sided):,0.01,Kurtosis:,4.19


Para prever os próximos passos, usamos o método ```predict```, e informamos quantos passos a frente queremos estimar.

In [7]:
proximos_12 = modelo_auto.predict(n_periods = 12)

proximos_12 

array([445.63490714, 420.39494201, 449.19822468, 491.83980669,
       503.3942907 , 566.86221826, 654.25989853, 638.59716697,
       540.88337989, 494.1262208 , 423.3322736 , 465.50710847])