[![Abra no Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ffserro/MVP/blob/master/mvp.ipynb)


# Regressão Linear para Series Temporais - Planejamento dos dispêndios de alimentação de militares da Marinha do Brasil

## Contextualização



### O que é o municiamento?
A Gestoria de Munciamento é o conjunto dos processos responsáveis por gerir diariamente a alimentação e subsistência dos militares e servidores lotados nas organizações militares da Marinha do Brasil.

As principais atividades da gestoria de municiamento são:
- Planejamento e aquisição de gêneros alimentícios
- Controle de estoque de gêneros alimentícios
- Escrituração e pagamento
- Prestação de contas


### Orçamento público e alimentação de militares
Por ser custeada com recursos do orçamento da União, a gestoria de municiamento se submete a um sistema rigoroso de planejamento, controle, fiscalização e transparência, para garantir que os valores sejam utilizados de forma eficiente, econômica e legal.

A compra de gêneros alimentícios é uma despesa recorrente e significativa. Uma gestão eficiente garante que os recursos financeiros sejam alocados de forma inteligente, evitando gastos desnecessários.

Uma boa gestão de estoques minimiza desperdícios de alimentos por validade ou má conservação.

Como em qualquer gasto público, a aquisição de suprimentos deve ser transparente e seguir todas as normas de controle, visando a economia e a responsabilidade fiscal.

<div align="justify">
O planejamento eficiente dos recursos logísticos é um dos pilares para a manutenção da prontidão e da capacidade operacional das Forças Armadas. Entre os diversos insumos estratégicos, a alimentação das organizações militares desempenha papel central, tanto no aspecto orçamentário quanto no suporte direto às atividades diárias. Na Marinha do Brasil, a gestão dos estoques e dos gastos com gêneros alimentícios envolve múltiplos órgãos e abrange um volume expressivo de transações financeiras e contábeis, tornando-se um processo complexo e suscetível a variações sazonais, econômicas e administrativas.

Neste cenário, prever com maior precisão os custos relacionados ao consumo de alimentos é fundamental para otimizar a alocação de recursos públicos, reduzir desperdícios, evitar rupturas de estoque e aumentar a eficiência do planejamento orçamentário. Tradicionalmente, esse processo é conduzido por meio de análises históricas e técnicas de planejamento administrativo. No entanto, tais abordagens muitas vezes não capturam adequadamente os padrões temporais e as variáveis externas que influenciam os gastos.

A ciência de dados, e em particular as técnicas de modelagem de séries temporais, surge como uma alternativa poderosa para aprimorar esse processo decisório. Modelos como SARIMA, Prophet, XGBoost e LSTM permitem identificar tendências, sazonalidades e anomalias nos dados, possibilitando não apenas previsões mais robustas, mas também a geração de insights que subsidiam políticas de abastecimento e aquisição.

Assim, o presente trabalho propõe a aplicação de técnicas de análise e previsão de séries temporais sobre os dados históricos de consumo de alimentos da Marinha do Brasil, com o objetivo de estimar os custos futuros e explorar padrões relevantes que possam apoiar o processo de gestão logística e orçamentária. A relevância deste estudo reside não apenas no ganho potencial de eficiência administrativa, mas também na contribuição para a transparência, a racionalização do gasto público e a modernização da gestão de suprimentos em instituições estratégicas para o país.
</div>

## Glossário


* Municiamento
* Rancho
* Etapa
* Comensal
* Série Temporal
* Tendência
* Sazonalidade
* Estacionariedade


## Modelagem

<div align="justify">
 O conjunto de dados que será apresentado traz informações sobre despesas mensais com alimentação de militares e servidores de grandes organizações.

 O balanço de paiol do mês anterior nos traz a informação valor total dos gêneros alimentícios armazenados na organização no último dia do mês anterior.

 Os gêneros podem ser adquiridos pelas organizações de quatro formas diferentes:
 - adquirindo os gêneros dos depósitos de subsistência da Marinha
 - adquirindo os gêneros através de listas de fornecimento de gêneros, que são licitações centralizadas realizadas para atender toda a Marinha
 - adquirindo os gêneros através da realização de licitações próprias
 - adquirindo os gêneros através de contratação direta, sem licitação

 As organizações podem transferir gêneros entre seus estoques, através da realização de remessas. Os gêneros são contabilizados então no paiol através de remessas recebidas e remesas expedidas.

 Os gêneros consumidos durante as refeições do dia (café da manhã, almoço, janta e ceia) são contabilizados como gêneros consumidos.

 Os gêneros consumidos fora das refeições, como o biscoito, café e açúcar que são consumidos durante o dia, são contabilizados como vales-extra.

 As eventuais perdas de estoque são contabilizadas como termos de despesa.

 Quanto às receitas, cada comensal lotado na organização autoriza um determinado valor despesa por dia. A soma dessa despesa autorizada no mês é o valor limite dos gêneros que poderão ser retirados do paiol.

 A modelagem para os dispêndios com gêneros alimentícios considera as seguintes variáveis:
 - a quantidade de pessoas às quais é oferecida alimentação
 - o custo dos alimentos em paiol
 - a composição do cardápio (englobando o perfil de consumo de cada organização)

 Assim, o gasto mensal $Y_m$ de determinada organização no mês $m$ pode ser expresso em termos de:
 - Efetivo atendido ($N_m$)
 - Custo de aquisição dos insumos ($P_m$)
 - Composição do cardápio e perfil de consumo ($C_m$)

 Ou seja, $Y_m = f(N_m, P_m, C_m)\ +\ ϵ_m$

 sendo que o gasto mensal $Y_m$ é o somatório dos gastos diários $Y_d$, expressos por:

\begin{align}
\mathbf{Y_d} = \sum_{i=1}^q \ N_i \cdot p_i \\ \\ \mathbf{Y_m} = \sum_{i=1}^{30} Y_{di}
\end{align}


</div>

## Trabalho

In [None]:
#@title Downloads necessários

# SE é a primeira vez que esta célula está sendo executada na sessão ENTÃO baixe os arquivos hospedados no github E instale as dependências do projeto.
![ ! -f '/content/pip_log.txt' ] && git clone 'https://github.com/ffserro/MVP.git' && pip uninstall torchvision torch torchaudio -y > '/content/pip_log.txt' && pip install -r '/content/MVP/requirements.txt' > '/content/pip_log.txt'

In [None]:
#@title Import de bibliotecas

# ============================================================
# Utilitários do sistema e manipulação de arquivos/datas
# ============================================================
from glob import glob                                         # Seleção de múltiplos arquivos via padrões (ex.: *.csv)
from datetime import datetime as dt, timedelta as td          # Manipulação de datas e intervalos de tempo
import matplotlib.dates as mdates                             # Manipulação de datas dos eixos dos gráficos
import itertools                                              # Criação de combinações e iterações eficientes

# ============================================================
# Manipulação numérica e de dados
# ============================================================
import pandas as pd                                           # Estruturas de dados tabulares (DataFrames)
import numpy as np                                            # Computação numérica de alta performance (arrays/vetores)

# ============================================================
# Visualização de dados
# ============================================================
import matplotlib.pyplot as plt                               # Visualizações estáticas básicas (gráficos 2D)
import seaborn as sns                                         # Visualizações estatísticas de alto nível (heatmaps, distribuições)
import plotly.express as px                                   # Visualizações interativas de alto nível
import plotly.graph_objects as go                             # Visualizações interativas detalhadas e customizáveis

# ============================================================
# Ferramentas estatísticas para séries temporais
# ============================================================
import statsmodels.api as sm                                  # Modelos estatísticos gerais
from statsmodels.tsa.stattools import adfuller                # Teste ADF (estacionariedade)
from statsmodels.tsa.seasonal import seasonal_decompose       # Decomposição de série (tendência/sazonalidade)
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf # Autocorrelação e autocorrelação parcial

# ============================================================
# Modelos clássicos de séries temporais (baseline)
# ============================================================
from statsmodels.tsa.statespace.sarimax import SARIMAX        # Modelo SARIMA/SARIMAX
from statsmodels.tsa.holtwinters import ExponentialSmoothing  # Suavização exponencial de Holt-Winters

# ============================================================
# Preparação e avaliação de dados
# ============================================================
from sklearn.model_selection import TimeSeriesSplit           # Validação cruzada para séries temporais
from sklearn.preprocessing import MinMaxScaler                # Normalização (0–1) para redes neurais e ML
from sklearn.metrics import mean_absolute_error, mean_squared_error  # Métricas de avaliação (MAE, MSE)

# ============================================================
# Modelos modernos de previsão
# ============================================================
from prophet import Prophet                                   # Modelo Prophet (captura tendência + sazonalidade)
from xgboost import XGBRegressor                              # Modelo baseado em boosting (árvores de decisão)

# Redes neurais (TensorFlow/Keras)
import tensorflow as tf
from tensorflow.keras.models import Sequential                # Estrutura sequencial de camadas
from tensorflow.keras.layers import LSTM, Dense,\
 BatchNormalization # Camadas para deep learning
from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau # Callbacks para treinamento robusto

# Modelos baseados em deep learning específicos de séries temporais
from neuralforecast import NeuralForecast
from neuralforecast.models import NBEATS                      # Arquitetura N-BEATS (estado da arte em forecasting)

# AutoML para séries temporais
from autogluon.timeseries import TimeSeriesPredictor          # AutoGluon (seleção automática de modelos)

# ============================================================
# Configurações gerais
# ============================================================
from warnings import filterwarnings
filterwarnings('ignore')                                      # Silencia warnings para manter a saída do notebook limpa

In [None]:
#@title Leitura dos dados brutos

# ============================================================
# Leitura e consolidação dos dados brutos
# ============================================================

# Carrega todos os arquivos de movimentação mensal (mmm) em um único DataFrame.
# - parse_dates=[['ano', 'mes']] combina as colunas 'ano' e 'mes' em um único campo datetime
# - glob encontra todos os arquivos .xlsx dentro da pasta de dados
mmm = pd.DataFrame()
mmm = pd.concat(
    [mmm] + [
        pd.read_excel(arquivo, parse_dates=[['ano', 'mes']])
        for arquivo in glob('/content/MVP/dados/mmm/*.xlsx')
    ],
    ignore_index=True
)

# Carrega todos os arquivos de etapas em um único DataFrame.
# Estrutura e lógica de leitura iguais ao dataset acima
etapas = pd.DataFrame()
etapas = pd.concat(
    [etapas] + [
        pd.read_excel(arquivo, parse_dates=[['ano', 'mes']])
        for arquivo in glob('/content/MVP/dados/etapas/*.xlsx')
    ],
    ignore_index=True
)

# Carrega as informações das organizações militares centralizadas e suas respectivas centralizadoras
centralizadas = pd.read_csv('/content/MVP/dados/om_centralizada.csv')

# Carrega informações complementares sobre as organizações militares
om_info = pd.read_csv('/content/MVP/dados/om_info.csv')


### Limpeza dos dados

#### Limpeza do conjunto de dados sobre os Mapas Mensais do Municiamento de 2019 a 2025

In [None]:
# Existem organizações que não possuem dados para todo o período analisado
mmm.groupby('nome').ano_mes.count().sort_values(ascending=False)

In [None]:

# Ao todo o conjunto de dados contempla 80 meses. Como será realizada uma análise de série temporal, vou considerar apenas as organizações que possuem dados para todo o período.
mmm = mmm[mmm.codigo.isin(mmm.codigo.value_counts()[mmm.codigo.value_counts() == 80].index)]

In [None]:
mmm = mmm[mmm.ano_mes < dt(2025, 7, 1)] # removendo os dados dos últimos meses. Não são confiáveis porque as comprovações ainda não tinham sido completamente consolidadas a época da coleta de dados.

#### Limpeza do conjunto de dados sobre informações das OM

In [None]:
# Verificando a existência de dados faltosos
(om_info.isna().sum()/len(om_info)).sort_values(ascending=False)

In [None]:
# Quantidade de entradas diferentes para cada coluna no conjunto de dados
om_info.nunique()

In [None]:
# Informações que não vao agregar conhecimento para o caso em tela, por serem nulos ou por conter informações irrelevantes
om_info.drop(columns=['COMIMSUP', 'CNPJ', 'TELEFONE', 'ODS', 'TIPO_CONEXAO', 'CRIACAO', 'MODIFICACAO'], inplace=True)

In [None]:
om_info[['DN_ID', 'SUB_DN_ID', 'AREA_ID', 'COD_SQ_LOCAL', 'NOME', 'CIDADE']].sort_values(by=['DN_ID', 'SUB_DN_ID', 'AREA_ID', 'COD_SQ_LOCAL'])

In [None]:
# As colunas SUB_DN_ID, AREA_ID e COD_SQ_LOCAL são pouco ou não descritivas
om_info.drop(columns=['SUB_DN_ID', 'AREA_ID', 'COD_SQ_LOCAL'], inplace=True)

In [None]:
om_info.sort_values(by='TIPO')

In [None]:
# A variável TIPO começa descrevendo os tipo de organizações, como A para bases aeronavais, B para bases, F para fuzileiros navais, N para navios, S para saúde e I para instrução. Porém o T entra em uma categoria geral como se em algum momento essa vaiável deixou de ser utilizada.
# Então se tornou pouco descritiva para os nossos objetivos

om_info.drop(columns=['TIPO'], inplace=True)

In [None]:
# observações com dados faltosos
om_info.loc[om_info.isna().sum(axis=1) != 0]

In [None]:
# Preenchendo manualmente os dados faltosos com informações da internet

om_info.loc[om_info.CODIGO==87310, 'BAIRRO'] = 'Plano Diretor Sul'
om_info.loc[om_info.CODIGO==87700, 'BAIRRO'] = 'Asa Sul'

#### Limpeza de dados do conjunto de dados sobre centralização do municiamento

In [None]:
# Primeira transformação a ser feita será padronizar a codificação das organizações por UASG

centralizadas['OM_CENTRALIZADA_ID'] = centralizadas.OM_CENTRALIZADA_ID.map(om_info.set_index('ID').CODIGO)
centralizadas['OM_CENTRALIZADORA_ID'] = centralizadas.OM_CENTRALIZADORA_ID.map(om_info.set_index('ID').CODIGO)

In [None]:
# Mais uma vez, eu só preciso das informações das organizações que estão presentes no conjunto de dados do Mapa Mensal do Municiamento
centralizadas = centralizadas[centralizadas.OM_CENTRALIZADORA_ID.isin(mmm.codigo.unique())]

In [None]:
# Drop de colunas pouco informativas para o problema em tela

centralizadas.drop(columns=['CONTATO', 'TELEFONE', 'CRIACAO', 'MODIFICACAO', 'GESTORIA_ID'], inplace=True)

In [None]:
# Remover do conjunto de dados as movimentações que aconteceram antes do período observado
centralizadas = centralizadas[~(pd.to_datetime(centralizadas.DATA_FIM) < dt(2019, 1, 1))]

In [None]:
# Verificação manual da coerência dos períodos municiados

centralizadas.groupby('OM_CENTRALIZADA_ID').filter(lambda x: len(x)> 1).sort_values(by=['OM_CENTRALIZADA_ID', 'DATA_INICIO'])

In [None]:
# Definindo algumas datas que as organizações passaram a ser centralizadas por outra centralizadora
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==11500) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==11500) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==49000) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==49000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==62000) & (centralizadas.OM_CENTRALIZADORA_ID==62000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==62000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==62500) & (centralizadas.OM_CENTRALIZADORA_ID==62500), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==62500) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==64000) & (centralizadas.OM_CENTRALIZADORA_ID==64000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==64000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==65701) & (centralizadas.OM_CENTRALIZADORA_ID==65701), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==65701) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==65730) & (centralizadas.OM_CENTRALIZADORA_ID==65701), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==65730) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==67000) & (centralizadas.OM_CENTRALIZADORA_ID==62000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==67000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==71000) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==71000) & (centralizadas.OM_CENTRALIZADORA_ID==71100), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==71000) & (centralizadas.OM_CENTRALIZADORA_ID==71100), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==71000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==72000) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==72000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==73000) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==73000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==73200) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==73200) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==76000) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==76000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==78000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==78000) & (centralizadas.OM_CENTRALIZADORA_ID==71000), 'DATA_INICIO']
centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==80000) & (centralizadas.OM_CENTRALIZADORA_ID==80000), 'DATA_FIM'] = centralizadas.loc[(centralizadas.OM_CENTRALIZADA_ID==80000) & (centralizadas.OM_CENTRALIZADORA_ID==81000), 'DATA_INICIO']

# Removendo algumas informações que estavam duplicadas
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==62600) & (centralizadas.OM_CENTRALIZADORA_ID==62600) & (centralizadas.TIPO_CENTRALIZACAO_ID.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==87400) & (centralizadas.OM_CENTRALIZADORA_ID==87400) & (centralizadas.TIPO_CENTRALIZACAO_ID.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==88000) & (centralizadas.OM_CENTRALIZADORA_ID==88000) & (centralizadas.TIPO_CENTRALIZACAO_ID.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==88133) & (centralizadas.OM_CENTRALIZADORA_ID==88133) & (centralizadas.TIPO_CENTRALIZACAO_ID.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==88701) & (centralizadas.OM_CENTRALIZADORA_ID==88000) & (centralizadas.DATA_FIM.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==95300) & (centralizadas.OM_CENTRALIZADORA_ID==95380) & (centralizadas.TIPO_CENTRALIZACAO_ID.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==95340) & (centralizadas.OM_CENTRALIZADORA_ID==95380) & (centralizadas.TIPO_CENTRALIZACAO_ID.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==95370) & (centralizadas.OM_CENTRALIZADORA_ID==95380) & (centralizadas.TIPO_CENTRALIZACAO_ID.isna())].index, inplace=True)
centralizadas.drop(index=centralizadas[(centralizadas.OM_CENTRALIZADA_ID==95380) & (centralizadas.OM_CENTRALIZADORA_ID==95380) & (centralizadas.DATA_INICIO==dt(2004, 1, 1))].index, inplace=True)

In [None]:
# Supondo que as relações que não possuem data fim estão em vigor até hoje
centralizadas.DATA_FIM.fillna(dt(2026,1,1), inplace=True)

#### Limpeza do conjunto de dados sobre etapas do municiamento

In [None]:
# Filtro para manter apenas etapas que sejam relevantes dado as organizações contantes do conjunto de dados dos Mapas Mensais do Municiamento
etapas = etapas[etapas.uasg.isin(mmm.codigo.unique())]

In [None]:
# Removendo as etapas de complementos, uma vez que o objetivo da contabilização das etapas é contar o número de pessoas de cada organização
etapas = etapas[~(etapas.codigo_etapa//100==6)]

#### Salvando os dados limpos

In [None]:
mmm.to_csv('/content/MVP/dados/mmm/mmm_limpo.csv', index=False)
om_info.to_csv('/content/MVP/dados/om_info_limpo.csv', index=False)
centralizadas.to_csv('/content/MVP/dados/om_centralizada_limpo.csv', index=False)
etapas.to_csv('/content/MVP/dados/etapas/etapas_limpo.csv', index=False)

### Exploração

In [None]:
mmm_marinha = mmm.groupby(['ano_mes'])[['totais_balanco_paiol_despesa']].sum().reset_index().rename(columns={'totais_balanco_paiol_despesa':'consumo'})

In [None]:
mmm_marinha = mmm_marinha.iloc[:-2]

In [None]:
mmm_marinha

In [None]:
mmm_etapas = pd.merge(left=mmm, right=etapas, how='inner', left_on=['ano_mes', 'codigo'], right_on=['ano_mes', 'uasg'])

In [None]:
# Filtra o dataframe mmm_etapas para incluir apenas os códigos de etapa 103 e 105, que representam diferentes tipos de refeições ou etapas de municiamento.
# Em seguida, seleciona as colunas 'ano_mes', 'nome', 'codigo_etapa' e 'quantidade' para visualização.
mmm_etapas[mmm_etapas.codigo_etapa.isin([103, 105])][['ano_mes', 'nome', 'codigo_etapa', 'quantidade']]

### Verificações

In [None]:
def plota_resultados(title, df=mmm_marinha, x_col='ano_mes', y_col='consumo', preds=None, labels=None):
    '''
    Plota a série temporal original e, opcionalmente, as previsões de um ou mais modelos.

    Args:
        df (pd.DataFrame): DataFrame contendo a série temporal original.
        x_col (str): Nome da coluna do eixo x (geralmente a coluna de data).
        y_col (str): Nome da coluna do eixo y (a variável a ser plotada).
        title (str): Título do gráfico.
        preds (dict, optional): Dicionário onde as chaves são os nomes dos modelos
                                 e os valores são tuplas (x_pred, y_pred) com as
                                 datas e os valores previstos. Defaults to None.
        labels (dict, optional): Dicionário para renomear os rótulos dos eixos
                                 no gráfico. Defaults to {x_col: 'Período', y_col: 'Valor observado'}.
    '''
    # Série real
    fig = px.line(
        df,
        x=x_col,
        y=y_col,
        labels=labels or {x_col: 'Período', y_col: 'Valor observado'},
        title=title
    )

    # Previsões opcionais
    if preds:
        for model_name, (x_pred, y_pred) in preds.items():
            fig.add_trace(go.Scatter(
                x=x_pred,
                y=y_pred,
                mode='lines+markers',
                name=f'Previsão — {model_name}',
                line=dict(width=2, dash='dash')
            ))

    # Layout padronizado
    fig.update_traces(line=dict(width=2))
    fig.update_xaxes(tickangle=45)
    fig.update_layout(
        template='plotly_white',
        hovermode='x unified'
    )

    return fig

# Gera o plot da série temporal original dos gastos com alimentação
fig = plota_resultados(
title='Gastos com alimentação dos últimos cinco anos'
)

# Exibe o gráfico
fig.show()

In [None]:
def checa_estacionariedade(serie, alpha=0.05):
    '''
    Executa o Teste de Dickey-Fuller Aumentado (ADF) para verificar
    se uma série temporal é estacionária.

    Parâmetros
    ----------
    serie : pd.Series
        Série temporal a ser testada.
    alpha : float, default=0.05
        Nível de significância para o teste de hipótese.

    Interpretação
    -------------
    H0 (hipótese nula): a série possui raiz unitária (não estacionária).
    H1 (alternativa): a série é estacionária.
    '''

    # Remove valores nulos antes do teste
    resultado = adfuller(serie.dropna())

    # Extrai estatísticas relevantes
    estatistica_adf = resultado[0]
    p_valor = resultado[1]
    num_lags = resultado[2]     # número de defasagens usadas no modelo
    num_obs = resultado[3]      # número de observações utilizadas

    # Exibe os principais resultados
    print(f'Estatística ADF: {estatistica_adf:.4f}')
    print(f'p-valor: {p_valor:.4f}')
    print(f'Nº lags utilizados: {num_lags}')
    print(f'Nº observações: {num_obs}')
    print('Valores críticos:', resultado[4])  # níveis de significância (1%, 5%, 10%)

    # Avaliação da hipótese nula
    if p_valor < alpha:
        print('Série estacionária (rejeita H0 de raiz unitária).')
    else:
        print('Série não estacionária (não rejeita H0).')

# ============================================================
# Verificação da estacionariedade da série de consumo
# ============================================================

checa_estacionariedade(mmm_marinha['consumo'])

In [None]:
# ============================================================
# Decomposição da série temporal em tendência, sazonalidade e resíduos
# ============================================================

# Aplica decomposição aditiva:
# consumo = tendência + sazonalidade + resíduo
# O parâmetro "period=12" assume sazonalidade anual (mensalidade em 12 meses).
decomp = seasonal_decompose(
    mmm_marinha.set_index('ano_mes')['consumo'],
    model='additive',
    period=12
)

# Gera visualização dos componentes:
# - Série observada
# - Tendência (variação de longo prazo)
# - Sazonalidade (padrões que se repetem periodicamente)
# - Resíduos (parte não explicada pelo modelo)
fig = decomp.plot()
fig.set_size_inches(20, 8)

for ax in fig.axes:
    ax.set_xlabel("Meses")
    ax.xaxis.set_major_locator(mdates.MonthLocator(interval=3))
    ax.xaxis.set_major_formatter(
        plt.matplotlib.dates.DateFormatter("%b/%Y")  # formato "Jan/2020"
    )
    ax.tick_params(axis="x", rotation=45)

plt.suptitle("Decomposição da Série Temporal (Modelo Aditivo)", fontsize=14, y=1.02)
plt.show()


In [None]:
# ============================================================
# Análise de Autocorrelação (ACF) e Autocorrelação Parcial (PACF)
# ============================================================

# Cria figura com dois subplots: um para ACF e outro para PACF
fig, ax = plt.subplots(2, 1, figsize=(12, 8))

# Autocorrelação (ACF)
# - Mede a correlação da série com suas próprias defasagens
# - Útil para identificar dependência temporal e possíveis lags para ARIMA
plot_acf(
    mmm_marinha['consumo'].dropna(),  # remove NaNs antes do cálculo
    lags=36,                           # número de defasagens a serem exibidas
    ax=ax[0]
)
ax[0].set_title("Autocorrelação (ACF) - Consumo")

# Autocorrelação Parcial (PACF)
# - Mede a correlação da série com uma defasagem específica,
#   removendo efeitos das defasagens intermediárias
# - Ajuda a identificar a ordem AR (p) em modelos ARIMA
plot_pacf(
    mmm_marinha['consumo'].dropna(),
    lags=36,
    ax=ax[1],
    method='ywm'   # método de estimação robusto para PACF
)
ax[1].set_title("Autocorrelação Parcial (PACF) - Consumo")

plt.tight_layout()
plt.show()

### Teste de modelos

In [None]:
train = mmm_marinha.iloc[:-12]
test = mmm_marinha.iloc[-12:]

#### Previsão Naïve (critério de comparação)

In [None]:
# ============================================================
# Previsão Naïve (Baseline)
# ============================================================

# A previsão "naïve" assume que o valor futuro é igual ao último valor observado.
# Aqui usamos shift(1) para criar previsões deslocadas em 1 período.
naive_forecast = mmm_marinha['consumo'].shift(1)

# Calcula o MAE (Mean Absolute Error) como métrica de avaliação
# - Excluímos o primeiro valor, pois a previsão para o primeiro ponto é NaN
mae_naive = mean_absolute_error(
    mmm_marinha['consumo'].iloc[1:],  # valores reais (a partir do segundo ponto)
    naive_forecast.iloc[1:]            # valores previstos pela abordagem naïve
)

print('Baseline Naïve MAE:', mae_naive)


In [None]:
fig = plota_resultados(
    df=mmm_marinha,
    x_col="ano_mes",
    y_col="consumo",
    title="Previsão temporal — Naïve",
    preds={
        "Naïve": (test.ano_mes, naive_forecast[-12:])
    }
)
fig.show()

#### Previsão SARIMA (critério de comparação)

In [None]:
# ============================================================
# Definição do espaço de busca
# ============================================================

# Parâmetros do componente ARIMA (p, d, q)
p = d = q = range(0, 3)  # valores de 0 a 2

# Parâmetros do componente sazonal (P, D, Q, m)
P = D = Q = range(0, 2)  # valores de 0 a 1
m = 12                   # sazonalidade mensal (12 meses)

# Todas as combinações possíveis
pdq = list(itertools.product(p, d, q))                          # combinações de (p, d, q)
seasonal_pdq = list(itertools.product(P, D, Q, [m]))            # combinações de (P, D, Q, m)

# ============================================================
# Busca pelo melhor modelo com base no critério AIC (Akaike Information Criterion)
# ============================================================
best_aic = np.inf                                               # inicializa com infinito
best_order, best_seasonal = None, None
best_model = None

# Loop por todas as combinações possíveis de parâmetros
for order in pdq:
    for seasonal_order in seasonal_pdq:
        try:
            # Ajusta o modelo SARIMA
            model = sm.tsa.statespace.SARIMAX(
                mmm_marinha['consumo'],                         # série temporal
                order=order,                                    # parâmetros (p, d, q)
                seasonal_order=seasonal_order,                  # parâmetros sazonais (P, D, Q, m)
                enforce_stationarity=False                      # não força estacionariedade
            )
            results = model.fit(disp=False)

            if results.aic < best_aic:                          # Atualiza se o modelo atual tiver melhor AIC
                best_aic = results.aic
                best_order, best_seasonal = order, seasonal_order
                best_model = results

        except Exception:
            continue                                            # Ignora combinações que não convergem para o caso de Decomposition error

# ============================================================
# Resultado final da busca
# ============================================================
print(
    f'Melhor modelo SARIMA encontrado: '
    f'order={best_order}, seasonal_order={best_seasonal}'
)


In [None]:
# ============================================================
# Criação do modelo SARIMA com os melhores hiperparâmetros encontrados
# ============================================================

model = SARIMAX(
    train.consumo,
    order=best_order,                                           # - order: parâmetros (p, d, q) para parte autorregressiva e de médias móveis
    seasonal_order=best_seasonal,                               # - seasonal_order: parâmetros sazonais (P, D, Q, m)
    enforce_stationarity=False                                  # - enforce_stationarity: desabilitado para maior flexibilidade
)

# ============================================================
# Ajuste do modelo aos dados de treino
# ============================================================

res = model.fit(disp=False, maxiter=500)                        # maxiter=500: limite de iterações para garantir a convergência

# ============================================================
# Exibição de métricas detalhadas do modelo ajustado
# ============================================================

print(res.summary().tables[1])                                  # a tabela traz os coeficientes e estatísticas de significância

# ============================================================
# Geração da previsão para o horizonte desejado (12 meses)
# ============================================================

pred = res.get_forecast(steps=12)
y_pred = pred.predicted_mean  # valores previstos

# Cálculo do viés (tendência de super ou subestimar os valores reais)
bias = abs(test.consumo - y_pred).mean()

# Ajuste da previsão removendo o viés médio
# → melhora a coerência da previsão em relação aos valores observados
y_pred_no_bias = y_pred - bias

# Avaliação da performance com a métrica MAE
# quanto menor, melhor a acurácia da previsão
print(f"SARIMA MAE: {mean_absolute_error(test['consumo'], y_pred_no_bias)}")

In [None]:
fig = plota_resultados(
    title="Previsão temporal — SARIMA",
    preds={
        "SARIMA": (test.ano_mes, y_pred_no_bias)
    }
)
fig.show()

#### Exponential Smoothing (critério de comparação)

In [None]:
# ============================================================
# Configurações do modelo Holt-Winters
# ============================================================

hw_config = {
    "trend": "add",                                             # modelo considera tendência aditiva (crescimento linear)
    "seasonal": "add",                                          # sazonalidade aditiva (variações se somam à tendência)
    "seasonal_periods": 12                                      # ciclo sazonal de 12 meses (dados mensais -> sazonalidade anual)
}

# ============================================================
# Instanciação e ajuste do modelo Holt-Winters
# ============================================================

hw_model = ExponentialSmoothing(
    train.consumo,                                              # série de treino
    **hw_config                                                 # passa as configurações definidas acima
).fit(
    optimized=True,                                             # ajusta automaticamente os melhores parâmetros de suavização
    use_brute=True                                              # força busca exaustiva para maior chance de encontrar parâmetros ótimos
)


forecast_horizon = 12                                           # horizonte de previsão (número de passos à frente)
pred_hw = hw_model.forecast(steps=forecast_horizon)             # geração de previsões

print(f"Holt-Winters MAE: {mean_absolute_error(test['consumo'], pred_hw):.2f}") # avaliação da previsão


In [None]:
fig = plota_resultados(
    title="Previsão temporal — ExponentialSmoothing",
    preds={
        "ExponentialSmoothing": (test.ano_mes, pred_hw)
    }
)
fig.show()


#### Prophet

In [None]:
# ============================================================
# Preparação dos dados para Prophet
# ============================================================
prophet_df = (
    mmm_marinha[['ano_mes', 'consumo']]                         # seleciona colunas relevantes
    .rename(columns={'ano_mes': 'ds', 'consumo': 'y'})          # renomeia para padrão Prophet: ds -> data, y -> valor
    .assign(ds=lambda d: pd.to_datetime(d['ds'], format='%m_%Y'))  # converte strings para datetime
    .sort_values('ds')                                          # garante ordem cronológica
    .reset_index(drop=True)                                     # reseta índice após ordenação
)

# ============================================================
# Configuração do modelo Prophet
# ============================================================
model_prophet = Prophet(
    yearly_seasonality=True,                                    # ativa sazonalidade anual
    weekly_seasonality=False,                                   # desativa sazonalidade semanal
    daily_seasonality=False,                                    # desativa sazonalidade diária
    seasonality_mode="additive",                                # modelo aditivo (soma tendência + sazonalidade)
    interval_width=0.95                                         # intervalo de confiança de 95% para previsão
)

# Ajuste do modelo aos dados de treino
model_prophet.fit(prophet_df)

# ============================================================
# Criação do dataframe para previsão futura
# ============================================================
forecast_horizon = 12                                           # meses à frente
future = model_prophet.make_future_dataframe(
    periods=forecast_horizon,                                   # número de passos à frente
    freq='M'                                                    # frequência mensal
)

# Geração das previsões
forecast = model_prophet.predict(future)

# ============================================================
# Seleção das previsões correspondentes ao conjunto de teste
# ============================================================
test_dates = pd.to_datetime(test['ano_mes'], format='%m_%Y')    # datas do teste
forecast_test = forecast.set_index('ds').loc[test_dates]        # filtra apenas o horizonte de teste

y_true = test['consumo']                # valores reais
prophet_y_pred = forecast_test['yhat']  # valores previstos

# ============================================================
# Avaliação do modelo
# ============================================================
mae = mean_absolute_error(y_true, prophet_y_pred)               # erro médio absoluto
rmse = mean_squared_error(y_true, prophet_y_pred)               # raiz do erro quadrático médio

print(f"Prophet — MAE: {mae:.2f} | RMSE: {rmse:.2f}")



In [None]:
fig = plota_resultados(
    title="Previsão temporal — Prophet",
    preds={
        "Prophet": (test.ano_mes, prophet_y_pred)
    }
)
fig.show()

#### XGBoost regressor

In [None]:
# ============================================================
# Preparação de features para XGBoost
# ============================================================
xg_df = mmm_marinha[['consumo']].copy()                         # série alvo

for lag in [1, 3, 6]:                                           # Criação de lags
    xg_df[f'lag{lag}'] = xg_df['consumo'].shift(lag)            # adiciona colunas com valores passados da série (lags)


for window in [3, 6]:                                           # Criação de médias móveis (rolling)
    xg_df[f'rolling{window}'] = xg_df['consumo'].rolling(window).mean() # adiciona colunas com média móvel da série, para capturar tendências locais


xg_df = xg_df.dropna().reset_index(drop=True)                   # Remove linhas com NaN gerados pelos lags e médias móveis e reseta índice

# ============================================================
# Separação treino / teste
# ============================================================
horizon = 12                                                    # últimos 12 períodos serão usados como teste
train_xg, test_xg = xg_df.iloc[:-horizon], xg_df.iloc[-horizon:]

X_train, y_train = train_xg.drop(columns=["consumo"]), train_xg["consumo"]  # features
X_test, y_test   = test_xg.drop(columns=["consumo"]), test_xg["consumo"]    # target

# ============================================================
# Configuração do modelo XGBoost
# ============================================================
xgb_params = dict(
    n_estimators=300,                                           # número de árvores
    learning_rate=0.05,                                         # taxa de aprendizado
    max_depth=5,                                                # profundidade máxima de cada árvore
    subsample=0.8,                                              # amostragem de linhas para cada árvore
    colsample_bytree=0.8,                                       # amostragem de colunas para cada árvore
    random_state=42,                                            # reprodutibilidade
    n_jobs=-1,                                                  # usa todos os núcleos disponíveis
    objective="reg:squarederror",                               # objetivo de regressão
    verbosity=0                                                 # sem logs de treino
)

xgb_model = XGBRegressor(**xgb_params)

# ============================================================
# Treinamento do modelo
# ============================================================

xgb_model.fit(X_train, y_train, eval_set=[(X_test, y_test)], verbose=False) # fornecendo eval_set apenas para monitoramento (não será usado na métrica final, evitando dat leakage)

# ============================================================
# Geração de previsões e avaliação
# ============================================================
pred_xgb = xgb_model.predict(X_test)

mae = mean_absolute_error(y_test, pred_xgb)                     # erro médio absoluto
rmse = mean_squared_error(y_test, pred_xgb)                     # raiz do erro quadrático médio

print(f"XGBoost — MAE: {mae:.2f} | RMSE: {rmse:.2f}")




In [None]:
fig = plota_resultados(
    title="Previsão temporal — XGBoost",
    preds={
        "XGBoost": (test.ano_mes, pred_xgb)
    }
)
fig.show()

#### LSTM

In [None]:
# ============================================================
# Normalização dos dados da série temporal
# ============================================================

scaler = MinMaxScaler(feature_range=(0, 1))                     # escalamos os dados para o intervalo [0,1] para ajudar a estabilizar o gradiente durante o treinamento da rede neural
despesas_scaled = scaler.fit_transform(
    mmm_marinha.consumo.values.reshape(-1, 1)                   # reshape para matriz 2D (requisito para o MinMaxScaler)
)

# ============================================================
# Função para criar janelas temporais (sequências)
# ============================================================
def create_sequences(data, window=12):
    """
    Constrói sequências de tamanho 'window' para predição de séries temporais.

    Args:
        data (array): série temporal escalada
        window (int): número de passos no histórico usados para prever o próximo valor

    Returns:
        X (array): entradas, cada linha é uma janela de 'window' passos
        y (array): saídas, cada valor é o próximo ponto a ser previsto
    """
    X, y = [], []
    for i in range(len(data) - window):
        X.append(data[i : i + window])                          # pega dados em uma janela de tamanho 'window'
        y.append(data[i + window])                              # o alvo é o valor logo após a janela
    return np.array(X), np.array(y)

X, y = create_sequences(despesas_scaled)                        # criação das sequências a partir da série normalizada

# ============================================================
# Separação treino / teste
# ============================================================
split = len(X) - 12                                             # últimos 12 pontos reservados para teste
X_train, X_test = X[:split], X[split:]
y_train, y_test = y[:split], y[split:]

print('Shape treino (X, y):', X_train.shape, y_train.shape)     # checando os formatos dos conjuntos criados para alimentar a rede neural


In [None]:
# ============================================================
# Definição do modelo LSTM
# ============================================================
model = Sequential([

    LSTM(128,                                                   # primeira camada LSTM com 128 neurônios
         activation='relu',                                     # activation 'ReLu para garantir a não-linearidade
         return_sequences=True,                                 # return_sequences para empilhar com outra LSTM
         input_shape=(12, 1)),                                  # janela de 12 steps e uma feature, de acordo com o shape dos dados de entrada

    BatchNormalization(),                                       # normaliza ativações, acelerando o treinamento e evitando explosão/desaparecimento do gradiente

    LSTM(64,                                                    # segunda camada LSTM com 64 neurônios
         activation='relu',
         return_sequences=False),                               # return_sequences falso, pois é a última camada de LSTM, retornando apenas o último estado

    BatchNormalization(),

    Dense(32, activation='relu'),                               # camadas densas totalmente conectadas para refinar padrões temporais
    Dense(32, activation='relu'),
    Dense(16, activation='relu'),

    Dense(1)                                                    # saída com 1 neurônio: previsão de um único valor contínuo
])

# ============================================================
# Compilação do modelo
# ============================================================




model.compile(
    optimizer=tf.keras.optimizers.Adam(                         # otimizador adam para um aprendizado adaptativo eficiente
        learning_rate=1e-3,
        beta_1=0.9,
        beta_2=0.999),
    loss='mae',                                                 # Função de perda: MAE (erro absoluto médio), comum em séries temporais
    metrics=['mse']                                             # Métrica: MSE (erro quadrático médio), para avaliação adicional
)

# ============================================================
# Callbacks para controle de treinamento
# ============================================================
callbacks = [
    EarlyStopping(monitor='val_loss', patience=200, restore_best_weights=True, verbose=1),  # para o treinamento cedo se não houver melhora na validação
    ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=200, min_lr=1e-5, verbose=1) # reduz a taxa de aprendizado se a validação estagnar
]

# ============================================================
# Treinamento do modelo
# ============================================================

history = model.fit(
    X_train, y_train,
    epochs=1000,                                                # treinamento em 1000 épocas (pode ser interrompido antes via EarlyStopping)
    batch_size=16,                                              # batch de tamanho 16 (quantidade de sequências que o modelo vê antes de cada atualização de gradiente)
    validation_data=(X_test, y_test),                           # dados do conjunto de testes para validação
    callbacks=callbacks,                                        # callbacks ativados para evitar desperdício de tempo no treinamento e devolver o melhor resultado conhecido
    verbose=1
)


In [None]:
# ============================================================
# Geração das previsões com o modelo LSTM
# ============================================================
y_pred = model.predict(X_test)                                  # obtém previsões no mesmo espaço escalado usado no treino

# ============================================================
# Inversão do escalonamento (voltar valores para escala original)
# ============================================================

y_test_inv = scaler.inverse_transform(y_test.reshape(-1, 1))    # "desnormalizando" y_test para comparação com os resultados da predição do modelo
y_pred_inv = scaler.inverse_transform(y_pred)                   # "desnormalizando" y_pred também para que eles retomem a amplitude dos dados originais

# ============================================================
# Avaliação do desempenho (MAE)
# ============================================================

mae_lstm = mean_absolute_error(y_test_inv, y_pred_inv)          # cálculo da média do erro absoluto entre valores reais e previstos, na escala original para interpretabilidade da métrica

print('LSTM MAE:', mae_lstm)

In [None]:
fig = plota_resultados(
    title="Previsão temporal — LSTM",
    preds={
        "LSTM": (test.ano_mes, y_pred_inv.flatten())
    }
)
fig.show()

#### Multistep LSTM

In [None]:
# ============================================================
# Função para criar janelas de treino com previsão multi-step
# ============================================================
def create_sequences_multistep(data, window=12, horizon=12):
    """
    Gera pares (X, y) para treinamento de modelos de séries temporais multistep.

    Args:
        data (array): série temporal escalada ou normalizada
        window (int): número de períodos usados como entrada (janelas passadas)
        horizon (int): número de períodos futuros a serem previstos

    Returns:
        X (np.array): sequências de entrada (amostras × janela × features)
        y (np.array): valores futuros (amostras × horizonte)
    """
    X, y = [], []

    for i in range(len(data) - window - horizon + 1):           # percorre a série até onde é possível formar uma janela completa + horizonte
        X.append(data[i:i+window])                              # janela de entrada (ex.: últimos 12 meses)
        y.append(data[i+window:i+window+horizon].flatten())     # horizonte de saída (ex.: próximos 12 meses)
    return np.array(X), np.array(y)


# ============================================================
# Criação dos conjuntos de dados
# ============================================================

window = 12                                                     # janela de 12 meses (1 ano de histórico para prever)
horizon = 12                                                    # previsão de 12 meses à frente
X, y = create_sequences_multistep(despesas_scaled, window, horizon)

# ============================================================
# Divisão treino/teste
# ============================================================
split = int(len(X) * 0.8)                                       # 80% treino, 20% teste
X_train, X_test = X[:split], X[split:]
y_train, y_test = y[:split], y[split:]

# ============================================================
# Verificação dos shapes
# ============================================================
print('X_train shape:', X_train.shape)                          # (amostras, janela, features)
print('y_train shape:', y_train.shape)                          # (amostras, horizonte)


In [None]:
# ============================================================
# Definição da arquitetura da rede LSTM para previsão multi-step
# ============================================================
model = Sequential([

    LSTM(128,                                                   # primeira camada LSTM (captura padrões temporais mais longos)
         activation='relu',
         return_sequences=True,
         input_shape=(window, 1)
         ),

    BatchNormalization(),                                       # normaliza a saída da camada LSTM para estabilizar o treinamento


    LSTM(64,                                                    # segunda camada LSTM (captura padrões mais refinados, sem retornar sequência completa)
         activation='relu',
         return_sequences=False
         ),

    BatchNormalization(),


    Dense(32, activation='relu'),                               # Camadas densas totalmente conectadas para refinar o aprendizado
    Dense(32, activation='relu'),

    # Camada de saída com dimensão igual ao horizonte de previsão
    Dense(horizon)  # previsão multi-step (ex.: 12 passos à frente)
])


# ============================================================
# Compilação do modelo
# ============================================================
model.compile(
    optimizer=tf.keras.optimizers.Adam(learning_rate=1e-2),  # otimizador Adam com taxa de aprendizado inicial mais alta
    loss="mse",    # erro quadrático médio (mais sensível a grandes desvios)
    metrics=["mae"]  # erro absoluto médio (interpretação direta em unidades originais)
)


# ============================================================
# Callbacks para controle do treinamento
# ============================================================
callbacks = [
    EarlyStopping(
        monitor="val_loss",        # monitora a perda de validação
        patience=200,              # interrompe se não houver melhora após 200 épocas
        restore_best_weights=True, # restaura os melhores pesos obtidos
        verbose=1
    ),
    ReduceLROnPlateau(
        monitor="val_loss",        # reduz a taxa de aprendizado se o modelo "empacar"
        factor=0.5,                # reduz pela metade
        patience=200,              # espera 200 épocas sem melhora
        min_lr=1e-5,               # limite mínimo de taxa de aprendizado
        verbose=1
    )
]


# ============================================================
# Treinamento do modelo
# ============================================================
history = model.fit(
    X_train, y_train,
    epochs=2000,                   # número máximo de épocas (early stopping pode parar antes)
    batch_size=16,                 # tamanho do lote (menor => mais ruído, maior => gradiente mais estável)
    validation_data=(X_test, y_test), # validação em dados de teste
    callbacks=callbacks,           # usa callbacks definidos acima
    verbose=1
)


In [None]:
# ============================================================
# Geração de previsões com o modelo treinado
# ============================================================
y_pred = model.predict(X_test)                                  # previsões para o conjunto de teste


# ============================================================
# Inversão da normalização
# ============================================================
y_test_inv = scaler.inverse_transform(y_test)                   # valores reais (teste)
y_pred_inv = scaler.inverse_transform(y_pred)                   # valores previstos


# ============================================================
# Avaliação da performance
# ============================================================
mae_lstm_multi = mean_absolute_error(y_test_inv.flatten(), y_pred_inv.flatten())
print('LSTM Multi-step MAE:', mae_lstm_multi)


In [None]:
fig = plota_resultados(
    title="Previsão temporal — Multi-step LSTM",
    preds={
        "Multi-step LSTM": (test.ano_mes, y_pred_inv[-1])
    }
)
fig.show()

#### N-Beats

In [None]:
# ============================================================
# Preparação dos dados para o N-BEATS
# ============================================================
train['item_id'] = 'mnc'                                        # identificador único da série temporal
nbeats_data = train.rename(                                     # o NeuralForecast exige colunas com nomes específicos
    columns={
        'item_id': 'unique_id',                                 # unique_id: identifica a série (mesmo que haja apenas uma)
        'ano_mes': 'ds',                                        # ds: datas (formato datetime)
        'consumo': 'y'                                          # y: valores observados (variável alvo)
        }
)

# ============================================================
# Configuração do modelo N-BEATS
# ============================================================
model = NBEATS(
    h=12,                                                       # h: horizonte de previsão (quantos passos à frente prever)
    input_size=36,                                              # input_size: quantidade de observações usadas como entrada
    stack_types=['seasonality', 'identity', 'trend', 'identity'], # stack_types: tipos de blocos (tendência, sazonalidade, identidade)
    n_blocks=[3, 3, 3, 2],                                      # n_blocks: número de blocos em cada pilha
    activation='ReLU',

    learning_rate=1e-3,                                         # learning_rate: taxa de aprendizado
    num_lr_decays=3,                                            # num_lr_decays: número de reduções de LR automáticas
    batch_size=16,                                              # batch_size: tamanho do lote (impacta velocidade/estabilidade do treino)
    scaler_type='robust',                                       # scaler_type: tipo de normalização ("robust" lida melhor com outliers)

    max_steps=1000,                                             # max_steps: limite de iterações no treinamento
    val_check_steps=10,                                         # val_check_steps: frequência de checagem no conjunto de validação
    early_stop_patience_steps=20                                # early_stop_patience_steps: paciência para early stopping
)

# ============================================================
# Treinamento do modelo
# ============================================================
nbeats_forecast = NeuralForecast(models=[model], freq='M')      # freq='M' indica que a série é mensal
nbeats_forecast.fit(df=nbeats_data, val_size=12)                # val_size=12 → reserva de 12 meses para validação

# ============================================================
# Geração das previsões
# ============================================================
y_pred_nbeats = nbeats_forecast.predict()                       # Retorna as previsões multi-step para o horizonte definido


In [None]:
fig = plota_resultados(
    title="Previsão temporal — N-Beats",
    preds={
        "N-Beats": (test.ano_mes, y_pred_nbeats.NBEATS.values.flatten())
    }
)
fig.show()

#### Autogluon

In [None]:
# ============================================================
# Preparação dos dados para o AutoGluon
# ============================================================
autogluon_data = nbeats_data.rename(                            # reaproveitando os dados utilizados para treinamento do NBeats (pois são de formato parecido)
    columns={                                                   # o AutoGluon espera as seguintes colunas:
        'unique_id': 'item_id',                                 # item_id: identifica a série temporal
        'ds': 'timestamp',                                      # timestamp: data/hora dos registros (datetime)
        'y': 'target'                                           # target: valores observados (variável alvo)
        }
)

# ============================================================
# Definição do horizonte de previsão
# ============================================================
prediction_length = 12                                          # prediction_length: número de passos à frente para prever

train_df = autogluon_data.iloc[:-prediction_length].copy()      # separação simples entre treino e teste
test_df  = autogluon_data.iloc[-prediction_length:].copy()

# ============================================================
# Criação de subconjuntos para treino/validação


# ============================================================
val_size = prediction_length                                    # val_size: tamanho do conjunto de validação
train_for_fit = autogluon_data.iloc[:-val_size].copy()
tune_for_fit  = autogluon_data.iloc[-val_size - prediction_length : -prediction_length].copy()  # tune_for_fit: dados imediatamente antes do teste (usados em ajuste fino)

# ============================================================
# Instanciação do AutoGluon TimeSeriesPredictor
# ============================================================
predictor = TimeSeriesPredictor(
    target='target',                                            # target: variável a ser prevista
    prediction_length=prediction_length,                        # prediction_length: horizonte da previsão
    eval_metric='MAE'                                           # eval_metric: métrica de avaliação primária
)

# ============================================================
# Treinamento do AutoGluon
# ============================================================
predictor.fit(
    train_data=train_for_fit,
    presets='best_quality',                                     # presets='best_quality': busca modelos mais robustos (mesmo que mais lentos)
    time_limit=600,                                             # time_limit: limite de tempo em segundos
    verbosity=2                                                 # verbosity: nível de detalhamento do log
)

# ============================================================
# Geração das previsões
# ============================================================
predictions = predictor.predict(autogluon_data)                 # aqui usamos o conjunto completo e o AutoGluon automaticamente deduz o ponto de corte a partor do 'prediction_length'


In [None]:
fig = plota_resultados(
    title="Previsão temporal — Autogluon",
    preds={
        "Autogluon": (test.ano_mes, predictions['mean'].values)
    }
)
fig.show()

### Seleção do melhor modelo

In [None]:
'''# #@title Comparação de modelos
# import ipywidgets as widgets
# from IPython.display import display, clear_output

# # Dropdowns interativos
# model_dropdown = widgets.Dropdown(
#     options=["SARIMAX", "Prophet", "XGBoost", "ExponentialSmoothing", "LSTM", "N-BEATS", "AutoGluon"],
#     value="LSTM",
#     description="Modelo:"
# )

# test_dropdown = widgets.Dropdown(
#     options=["A", "B", "C"],
#     value="A",
#     description="Teste:"
# )

# output = widgets.Output()

# def update_plot(change):
#     with output:
#         clear_output()
#         model = model_dropdown.value
#         test_set = test_dropdown.value

#         print(f"📊 Modelo selecionado: {model}")
#         print(f"📂 Conjunto de teste : {test_set}")

#         # Seleção de previsão
#         if model == "LSTM":
#             y_pred = pred_lstm
#         elif model == "XGBoost":
#             y_pred = pred_xgb
#         elif model == "Prophet":
#             y_pred = forecast_test['yhat']
#         elif model == "SARIMAX":
#             y_pred = pred_sarimax
#         elif model == "ExponentialSmoothing":
#             y_pred = pred_hw
#         elif model == "N-BEATS":
#             y_pred = y_pred_nbeats
#         elif model == "AutoGluon":
#             y_pred = y_pred_autogluon

#         # Plot interativo
#         fig = grafico_base(f"Previsão temporal com {model}")
#         fig.add_scatter(x=test.ano_mes, y=y_pred, mode="lines+markers", name=f"{model} Forecast")
#         fig.show()

# # Ligando evento
# model_dropdown.observe(update_plot, names="value")
# test_dropdown.observe(update_plot, names="value")

# display(model_dropdown, test_dropdown, output)

# # Render inicial
# update_plot(None)
'''

### Conclusões

## Trabalhos futuros