In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import seaborn as sns
from statsmodels.tsa.holtwinters import ExponentialSmoothing
from sklearn.metrics import mean_absolute_error, mean_squared_error

# Configura√ß√£o Visual
sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (15, 6)

1. Carregamento dos Dados Processados

    Importei a s√©rie temporal mensal gerada na etapa de An√°lise Explorat√≥ria.

In [None]:
# Carregando
df = pd.read_csv('../data/vendas_mensais.csv', index_col='Order Date', parse_dates=True)

df.index.freq = 'MS' 
df.info()

2. Divis√£o Treino vs Teste (Backtesting)

    Para validar o modelo, simulei uma viagem no tempo.

    Treino: Dados de 2014 at√© final de 2016.
    
    Teste: O ano de 2017 inteiro (12 meses). O modelo tentar√° prever 2017 sem nunca ter visto esses dados.

In [None]:
# Definindo o horizonte de previs√£o (12 meses)
meses_teste = 12

treino = df.iloc[:-meses_teste]
teste = df.iloc[-meses_teste:]

print(f"Per√≠odo de Treino: {treino.index.min().date()} at√© {treino.index.max().date()}")
print(f"Per√≠odo de Teste:  {teste.index.min().date()} at√© {teste.index.max().date()}")

3. Cria√ß√£o dos Modelos;

  Testarei duas hip√≥teses de sazonalidade:

    Modelo Aditivo: Assume que o aumento nas vendas sazonais √© fixo (ex: +100 unidades).

    Modelo Multiplicativo: Assume que o aumento √© proporcional (ex: +10% sobre o volume atual).

    Dado o crescimento da empresa visto na an√°lise explorat√≥ria, espera-se que o Multiplicativo performe melhor.

In [None]:
# --- Modelo 1: Aditivo (BModelo usado anteriormente) ---
modelo_add = ExponentialSmoothing(
    treino['Quantity'],
    trend='add',
    seasonal='add',
    seasonal_periods=12
).fit()
pred_add = modelo_add.forecast(steps=meses_teste)

# --- Modelo 2: Multiplicativo (Modelo novo) ---
modelo_mul = ExponentialSmoothing(
    treino['Quantity'],
    trend='add',
    seasonal='mul',
    seasonal_periods=12
).fit()
pred_mul = modelo_mul.forecast(steps=meses_teste)

4. Compara√ß√£o Visual: Realidade vs Previs√£o
    O gr√°fico abaixo sobrep√µe as previs√µes aos dados reais de 2017 (Dados de Teste).

In [None]:
fig, ax = plt.subplots(figsize=(16, 8))

# 1. Dados de Treino (Hist√≥rico)
ax.plot(treino.index, treino['Quantity'], label='Treino (Hist√≥rico)', color='gray', alpha=0.5)

# 2. Dados Reais (O gabarito)
ax.plot(teste.index, teste['Quantity'], label='Realidade (Teste)', color='green', linewidth=2, marker='o')

# 3. Previs√£o Aditiva
ax.plot(teste.index, pred_add, label='Previs√£o Aditiva', color='red', linestyle='--', alpha=0.7)

# 4. Previs√£o Multiplicativa
ax.plot(teste.index, pred_mul, label='Previs√£o Multiplicativa', color='blue', linewidth=2.5, linestyle='-')

# Formata√ß√£o de Datas
ax.xaxis.set_major_locator(mdates.MonthLocator(interval=3))
ax.xaxis.set_major_formatter(mdates.DateFormatter('%b %Y'))

plt.title('Batalha de Modelos: Aditivo vs Multiplicativo', fontsize=16)
plt.ylabel('Vendas')
plt.legend()
plt.show()

5. Scorecard (Avalia√ß√£o Matem√°tica)

    Utilizei o MAPE (Mean Absolute Percentage Error) para definir o vencedor. Ele indica, em m√©dia, quantos % o modelo erra.

In [None]:
def calcular_mape(y_real, y_pred):
    return np.mean(np.abs((y_real - y_pred) / y_real)) * 100

mape_add = calcular_mape(teste['Quantity'], pred_add)
mape_mul = calcular_mape(teste['Quantity'], pred_mul)

print(f"Erro Modelo Aditivo:        {mape_add:.2f}%")
print(f"Erro Modelo Multiplicativo: {mape_mul:.2f}%")

melhor_modelo = "Multiplicativo" if mape_mul < mape_add else "Aditivo"
print(f"\nüèÜ Vencedor: Modelo {melhor_modelo}")

6. Teste real

    Agora que validei que o modelo Multiplicativo √© superior, vamos retrein√°-lo com TODOS os dados (Treino + Teste) para prever o ano de 2018 real.

In [None]:
# Treinando com o dataset COMPLETO (at√© a √∫ltima data dispon√≠vel)
modelo_final = ExponentialSmoothing(
    df['Quantity'],
    trend='add',
    seasonal='mul',
    seasonal_periods=12
).fit()

# Prevendo 12 meses para frente (2018)
forecast_2018 = modelo_final.forecast(steps=12)

# Plotando apenas o resultado final
fig, ax = plt.subplots(figsize=(14, 6))
df['Quantity'].plot(ax=ax, label='Hist√≥rico')
forecast_2018.plot(ax=ax, label='Previs√£o 2018', color='orange', linewidth=3)
plt.title('Previs√£o de Demanda para 2018')
plt.legend()
plt.show()

# Exportando para entregar ao "Gestor"
forecast_2018.to_csv('../data/previsao_2018.csv')
print("Previs√£o salva com sucesso!")