# Séries Temporais

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as srn
srn.set()

In [None]:
#!pip install pmdarima

In [None]:
from datetime import datetime
from statsmodels.tsa.seasonal import seasonal_decompose
from pmdarima.arima import auto_arima

## Exploração dos dados

In [None]:
dataset = pd.read_csv('dados\AirPassengers.csv')
print(dataset.shape)
dataset.head()

In [None]:
dateparse = lambda dates: pd.datetime.strptime(dates, '%Y-%m')
dataset = pd.read_csv('dados\Airpassengers.csv', parse_dates=['Month'], index_col='Month', date_parser=dateparse)

In [None]:
dataset.info()  # month virou a coluna índice

In [None]:
time_series = dataset['#Passengers']
time_series  # temos todas as explorações que o datetime permite

In [None]:
print(time_series.index.max())  # mais novo
print(time_series.index.min())  # mais belho

In [None]:
plt.plot(time_series);

In [None]:
time_series_ano = time_series.resample('A').sum()
plt.plot(time_series_ano)  # por ano

In [None]:
time_series_mes = time_series.groupby([lambda x: x.month]).sum()
plt.plot(time_series_mes);  # por mês

In [None]:
time_series_datas = time_series['1960-01-01':'1960-12-01']
plt.plot(time_series_datas);  # por um periodo específico

## Decomposição da série temporal

In [None]:
decomposicao = seasonal_decompose(time_series)

# pode ser dividido em trêscaracterística:
tendencia = decomposicao.trend
sazonal = decomposicao.seasonal
aleatorio = decomposicao.resid

In [None]:
plt.plot(tendencia);
plt.title('Tendência da série temporal')
plt.show()

# aumenta com os anos

In [None]:
plt.plot(sazonal);
plt.title('Sazonalidade da série temporal')
plt.show()

# pico nas férias (julho, agosto, setembro)

In [None]:
plt.plot(aleatorio);
plt.title('Aleatoriedade da série temporal')
plt.show()

# sem padrão definido

## Previsões com ARIMA

In [None]:
# Parâmetros P, Q e D
model = auto_arima(time_series, order=(2, 1, 2))

In [None]:
previsoes = model.predict(n_periods=12)  
previsoes   # para 12 datas pra frente (um ano)

In [None]:
len(time_series)

In [None]:
train = time_series[:130]
test = time_series[130:]
train.shape, test.shape

In [None]:
print(train.index.min(), train.index.max())
print(test.index.min(), test.index.max())

In [None]:
model2 = auto_arima(train, suppress_warning=True)

In [None]:
previsoes = pd.DataFrame(model2.predict(n_periods=14), index=test.index)
previsoes.columns = ['passengers_predictions']
previsoes.shape

In [None]:
plt.figure(figsize=(8,5))
plt.plot(train, label='Training')
plt.plot(test, label='Testing')
plt.plot(previsoes, label='Predictions')
plt.legend()
plt.show();

As Previsoes obteram:
- um valor máximo menor do que os valores originais
- um valor mínimo menor do que os valores originais
- não teve a mesma forma

## Séries temporais com Facebook Prophet

In [None]:
#!pip install fbprophet 

In [None]:
from fbprophet import Prophet  # doesnt work for windows

In [None]:
dataset = pd.read_csv('dados\page_wikipedia.csv')
print(dataset.shape)
dataset.head()

In [None]:
dataset.describe()

In [None]:
dataset.hist();

In [None]:
dataset = dataset[['date', 'views']].rename(columns={'date':'ds', 'views':'y'})
dataset = dataset.sort_values(by='ds')
dataset.head()

### Construindo o modelo

In [None]:
model = Prophet()
model.fit(dataset)

In [None]:
future = model.make_future_dataframe(periods=90)
forecast = model.predict(future)

In [None]:
forecast.head()

In [None]:
len(dataset), len(forecast)

In [None]:
len(forecast) - len(dataset)

In [None]:
forecast.tail(90)

### Gráfico das previsões