# Utilit√°rios Unificados ‚Äî Modelos, Datasets e Ru√≠do

Este arquivo re√∫ne tr√™s fun√ß√µes principais, com interface unificada e documenta√ß√£o clara:

1. `load_model_unificado(modelo, caminho, ...)`
   - Carrega qualquer modelo: `linear`, `mlp`, `lstm` (Keras) ou `tft` (PyTorch Forecasting).
   - Aceita arquivo/diret√≥rio EXATO ou uma pasta raiz para descoberta recursiva.

2. Carregamento de dados (Parquet)
   - `linear/mlp/lstm` ‚Üí Parquet com `*.meta.json` contendo `x_dim`, `y_dim` (e `seq_len`, `lead` no LSTM).
   - `tft` ‚Üí Parquet (padr√£o: retorna DataFrame; opcional: cria `TimeSeriesDataSet`).

3. `add_noise_features(obj, sigma, tipo, ...)`
   - Adiciona ru√≠do GAUSSIANO somente nas FEATURES.
   - `tipo='tfdata'` ‚Üí aplica em `tf.data.Dataset` (x,y).
   - `tipo='tft'` ‚Üí aplica em batches de `TimeSeriesDataSet`/`DataLoader` (chaves `encoder_cont`/`decoder_cont`).

> Observa√ß√£o: O notebook foi simplificado para Parquet apenas (sem TFRecords).

## 1) Carregamento Unificado de Modelos

Contrato r√°pido:
- Entradas:
  - `modelo`: `linear` | `mlp` | `lstm` | `tft`
  - `caminho`: arquivo/diret√≥rio exato OU uma pasta para varredura recursiva
  - `prefer_exts` (opcional): lista de extens√µes a priorizar (ex.: `[".cpfg", ".ckpt"]` para TFT)
  - `allow_unsafe` (bool): permite desserializa√ß√£o insegura apenas para artefatos LOCAIS (Lambda em Keras)
- Sa√≠das: `(obj_modelo, info)`
  - `obj_modelo`: instancia do modelo carregado (Keras ou TemporalFusionTransformer)
  - `info`: dicion√°rio com metadados √∫teis (`path`, `backend`, `kind`)

In [None]:
# Carregamento dos modelos treinados
import torch
from tensorflow import keras
import json, os

def load_model(path: str):
    if not os.path.exists(path):
        raise FileNotFoundError(f"‚ùå File not found: {path}")

    ext = os.path.splitext(path)[1].lower()

    # === Load model ===
    if ext == ".keras":
        model = keras.models.load_model(path)
        print("‚úÖ TensorFlow model loaded.")
    elif ext in [".ckpt", ".cptk"]:
        model = torch.load(path, map_location="cpu")
        print("‚úÖ PyTorch Lightning checkpoint loaded.")
    else:
        raise ValueError(f"‚ùå Unsupported file extension: {ext}")

    # === Load optional JSON config ===
    json_path = f"{os.path.splitext(path)[0]}.model.json"
    config = None
    if os.path.exists(json_path):
        with open(json_path, "r") as f:
            config = json.load(f)
        print(f"üß© Loaded config: {json_path}")

    return model, config

# Example usage:
# model, config = load_model("/path/to/model.keras")
# model, config = load_model("/path/to/model.ckpt")


## Carregando modelo linear
linear, info_linear = load_model('./modelos/treinamento/linear_Medium.keras')

## Carregando modelo MLP
mlp, info_mlp = load_model('./modelos/treinamento/mlp_Medium.keras')

## Carregando modelo LSTM
lstm, info_lstm = load_model('./modelos/treinamento/lstm_Medium.keras')

## Carregando modelo TFT
tft, info_tft = load_model('./modelos/treinamento/TFT/tft_Medium/best.ckpt')

model_list = [
    (linear, info_linear),
    (mlp, info_mlp),
    (lstm, info_lstm),
    (tft, info_tft)
]

In [None]:
## 2) Carregando preprocessadores

In [None]:
import glob
import pickle
import tensorflow as tf
from typing import Dict, Any, List, Tuple, Optional

# === LINEAR ===
linear_path = "./data/treinamento/preprocessor/linear_preproc.pkl"
with open(linear_path, "rb") as f:
    linear_preproc = pickle.load(f)


# === LSTM ===
lstm_path = "./data/treinamento/preprocessor/lstm_preproc.pkl"
with open(lstm_path, "rb") as f:
    lstm_preproc = pickle.load(f)

# === TFT ===
tft_path = "./data/treinamento/preprocessor/tft_preproc.pkl"
with open(tft_path, "rb") as f:
    tft_preproc = pickle.load(f)

# === PREPROCESSORS DICT ===
preprocessors = {
    "linear": linear_preproc,
    "mlp": linear_preproc,  # MLP usa o mesmo pr√©-processador do Linear
    "lstm": lstm_preproc,
    "tft": tft_preproc,
}

print("‚úÖ Todos os preprocessadores carregados com sucesso.")


# Fun√ß√µes helper para an√°lise dos modelos

## Fun√ß√µes de coleta de dados

In [None]:

import pandas as pd
from preprocessor import LinearPreprocessor, LSTMPreprocessor, TFTPreprocessor
import numpy as np

def load_dataset_info(model_type: str, dataset_type: str) -> Dict[str, Any]:
    info_path = f'./data/treinamento/{model_type}_dataset_{dataset_type}.meta.json'
    if not os.path.exists(info_path):
        raise FileNotFoundError(f"‚ùå Dataset info file not found: {info_path}")
    with open(info_path, 'r') as f:
        info = json.load(f)
    return info


def redimension(*args, **kwargs):
    """
    Redimensiona/corta o dataset conforme o tipo de modelo.

    Formas de uso esperadas pelo loader:
    - Linear: redimension(df, type='linear', lag=..., lead=..., dataset_info=..., mask_value=...)
      Onde df √© um DataFrame com colunas lags/leads e features. (Comportamento normal)

    - LSTM (duas formas) ‚Äî APENAS X √© ajustado; Y permanece intacto:
      a) redimension(df, type='lstm', lag=..., lead=...)
         Onde df √© um DataFrame com colunas 'X' e 'Y'; cada c√©lula cont√©m um tensor/ndarray por amostra.
      b) redimension(X, Y, type='lstm', lag=..., lead=...)
         Onde X e Y s√£o arrays j√° empilhados (batch) no formato (N, T, F) e (N, H, D) respectivamente.

    - TFT: redimension(df, type='tft', ...)
      Retorna df inalterado.
    """
    model_type = kwargs.get('type') or kwargs.get('model_type')
    lag = kwargs.get('lag')
    lead = kwargs.get('lead')
    mask_value = kwargs.get('mask_value', np.nan)
    dataset_info = kwargs.get('dataset_info')

    if model_type not in ["linear", "lstm", "tft"]:
        raise ValueError(f"‚ùå Tipo de modelo inv√°lido: {model_type}")
    if not isinstance(lag, int) or not isinstance(lead, int) or lag <= 0 or lead <= 0:
        raise ValueError("‚ùå Par√¢metros 'lag' e 'lead' devem ser inteiros positivos.")

    # ======== LINEAR (comportamento normal) ======== #
    if model_type == 'linear':
        if len(args) != 1:
            raise TypeError("Para 'linear', redimension deve receber um √∫nico argumento: DataFrame df")
        df = args[0]
        if not isinstance(df, pd.DataFrame):
            raise TypeError("Para 'linear', o primeiro argumento deve ser um DataFrame")
        if dataset_info is None or not isinstance(dataset_info, dict):
            raise ValueError("‚ùå √â necess√°rio fornecer 'dataset_info' v√°lido para o modelo linear.")

        print(f"üîß Redimensionando dataset Linear (lag={lag}, lead={lead})...")

        # Detecta colunas de lag e lead v√°lidas
        valid_lags = [f"quantity_MW_lag{i}" for i in range(1, lag + 1)]
        valid_leads = [f"quantity_MW_lead{i}" for i in range(1, lead + 1)]

        # Aplica m√°scara nas colunas fora do intervalo permitido
        for col in df.columns:
            if ('lag' in col or 'lead' in col):
                try:
                    idx = int(''.join([c for c in col if c.isdigit()]) or 0)
                    if ('lag' in col and idx > lag) or ('lead' in col and idx > lead):
                        df[col] = mask_value
                except ValueError:
                    pass  # ignora colunas que n√£o tenham √≠ndice num√©rico

        # Mant√©m apenas colunas esperadas
        expected_cols = dataset_info.get('feature_cols', []) + dataset_info.get('target_cols', [])
        df = df[[c for c in df.columns if c in expected_cols or c in valid_lags + valid_leads]]
        print(f"‚úÖ Dataset Linear redimensionado com {df.shape[0]} linhas e {df.shape[1]} colunas.")
        return df.reset_index(drop=True)

    # ======== LSTM (ajusta apenas X; Y intacto) ======== #
    if model_type == 'lstm':
        print(f"üîß Redimensionando dataset LSTM (lag={lag}, lead={lead}) ‚Äî APENAS X ser√° ajustado; Y permanece intacto...")

        # Caso (b): X, Y j√° empilhados como arrays (N, T, F) e (N, H, D)
        if len(args) >= 2:
            X, Y = args[0], args[1]
            X = np.array(X)
            # N√ÉO alterar Y

            if X.ndim < 2:
                raise ValueError(f"‚ùå Esperado X com pelo menos 2 dimens√µes (N, T, ...), obtido {X.shape}")
            # Corta eixo temporal de X
            if X.shape[1] > lag:
                X = X[:, :lag, ...]
            elif X.shape[1] < lag:
                raise ValueError(
                    f"‚ùå X possui T={X.shape[1]} < lag={lag}. Ajuste 'lag' ou gere janelas compat√≠veis."
                )

            print(f"‚úÖ Dataset LSTM (arrays) final ‚Üí X: {X.shape}, Y (inalterado): {np.array(args[1]).shape}")
            return X, args[1]

        # Caso (a): df com colunas 'X' e 'Y', cada linha √© uma amostra
        if len(args) == 1:
            df = args[0]
            if isinstance(df, pd.DataFrame) and {'X', 'Y'}.issubset(df.columns):
                X_list, Y_list = [], []
                for _, row in df.iterrows():
                    X_item, Y_item = np.array(row['X']), row['Y']  # mant√©m Y_item como veio

                    # Corta excesso/valida m√≠nimos em X
                    if X_item.shape[0] > lag:
                        X_item = X_item[:lag, ...]
                    elif X_item.shape[0] < lag:
                        continue  # ignora amostras com X incompleto

                    X_list.append(X_item)
                    Y_list.append(Y_item)  # Y intacto

                if len(X_list) == 0:
                    raise ValueError("‚ùå Nenhuma amostra v√°lida ap√≥s ajuste por lag em X.")

                X = np.stack(X_list)

                # Tenta empilhar Y apenas se compat√≠vel; sen√£o retorna como object array
                try:
                    Y = np.stack([np.array(y) for y in Y_list])
                except Exception:
                    Y = np.array(Y_list, dtype=object)

                # Sanity check de X
                if X.ndim != 3:
                    raise ValueError(f"‚ùå Esperado X com 3 dimens√µes (amostras, lag, features), obtido {X.shape}")

                print(f"‚úÖ Dataset LSTM (DataFrame) final ‚Üí X: {X.shape}, Y (inalterado): {Y.shape if hasattr(Y,'shape') else 'obj-array'}")
                return X, Y

        raise TypeError("‚ùå Entrada inv√°lida para LSTM. Use (X, Y) arrays ou DataFrame com colunas 'X' e 'Y'.")

    # ======== TFT ======== #
    if model_type == 'tft':
        if len(args) != 1:
            raise TypeError("Para 'tft', redimension deve receber um √∫nico argumento: DataFrame df")
        print("‚ÑπÔ∏è Tipo 'tft' detectado: dataset j√° est√° no formato esperado. Nenhum redimensionamento aplicado.")
        return args[0]


def get_problem_df(model_type: str, lag, lead, country_list, problem_name) -> pd.DataFrame:
    # Instanciando preprocessadores
    dataset_info = load_dataset_info(model_type, "test")
    destino_dir = f'./data/{problem_name}'

    if model_type == 'linear':
        df, dataset_info = LinearPreprocessor.load_linear_parquet_dataset(
        data_dir=destino_dir,
        split='test',
        batch_size=256,
        shuffle=True
        )
    elif model_type == 'lstm':
        df,dataset_info = LSTMPreprocessor.load_lstm_parquet_dataset(
        data_dir=destino_dir,
        split='test',
        batch_size=256,
        shuffle=True
        )
    elif model_type == 'tft':
        preproc = TFTPreprocessor(
        model_name="TFT",
        seq_len=lag,
        lead=lead,
        country_list=country_list,
        feature_cols=dataset_info['feature_cols'],
        target_cols=dataset_info['target_cols'],
        data_dir=destino_dir
    )
        df = preproc.load_tft_dataset('test', target_col=dataset_info['target_cols'][0])
    else:
        raise ValueError(f"Modelo desconhecido: {model_type}")
    return df, dataset_info

## Fun√ß√£o de Desnormaliza√ß√£o e Decoding

In [None]:
# Helper: denormalize + decode using a given Preprocessor instance
from typing import Optional, Dict, Any
import pandas as pd
import numpy as np

def denorm_decode(
    preproc,
    df: Optional[pd.DataFrame] = None,
    normalization_method: Optional[str] = None,
    *,
    decode_time: bool = True,
    decode_label: bool = True,
) -> pd.DataFrame:
    """
    Restaura um DataFrame ao estado original usando os m√©todos do *preprocessor*:
    - denormalize(): reverte normaliza√ß√£o baseada no scaler salvo em preproc.norm_objects
    - decode(): desfaz encodings (label e/ou time_cycle) quando metadados existirem

    Par√¢metros
    - preproc: inst√¢ncia de LinearPreprocessor | LSTMPreprocessor | TFTPreprocessor
    - df: DataFrame a restaurar; se None, usa preproc.df_base
    - normalization_method: qual chave usar em preproc.norm_objects; se None, usa a primeira dispon√≠vel
    - decode_time: se True, tenta decodificar componentes c√≠clicos de tempo
    - decode_label: se True, tenta decodificar labels categ√≥ricos (ex.: country)

    Observa√ß√µes
    - A opera√ß√£o trabalha em preproc.df_base (conforme API da classe). Sempre retorna uma c√≥pia restaurada.
    - Para datasets LSTM salvos como (X,Y) flatten/arrays, a denormaliza√ß√£o direta n√£o se aplica aqui; use a denorm nas s√©ries base antes de gerar janelas.
    """
    if df is not None:
        preproc.df_base = df.copy()
    elif getattr(preproc, 'df_base', None) is None or preproc.df_base.empty:
        raise ValueError("df n√£o fornecido e preproc.df_base est√° vazio.")

    # 1) Denormalize, se houver scaler registrado
    if normalization_method is None:
        # pega a primeira chave dispon√≠vel (ex.: 'minmax' ou 'standard')
        norm_keys = list((getattr(preproc, 'norm_objects', {}) or {}).keys())
        normalization_method = norm_keys[0] if norm_keys else None

    if normalization_method:
        try:
            preproc.denormalize(normalization_method=normalization_method)
        except Exception as e:
            print(f"[WARN] Falha ao denormalizar com m√©todo '{normalization_method}': {e}")
    else:
        print("[INFO] Nenhum m√©todo de normaliza√ß√£o encontrado no preprocessor; pulando denormalize().")

    # 2) Decodes opcionais
    if decode_label and 'label' in getattr(preproc, 'encod_objects', {}):
        try:
            preproc.decode(encode_method='label')
        except Exception as e:
            print(f"[WARN] Falha ao decodificar labels: {e}")

    if decode_time and 'time_cycle' in getattr(preproc, 'encod_objects', {}):
        try:
            preproc.decode(encode_method='time_cycle', target_col='decoded_datetime')
        except Exception as e:
            print(f"[WARN] Falha ao decodificar time_cycle: {e}")

    return preproc.df_base.copy()

## Fun√ß√µes de avalia√ß√£o

In [None]:
import os
import shutil
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
import pandas as pd


def sanity_check_prefetch(ds):
    for x, y in ds.take(1):
        print(np.std(x.numpy(), axis=0))  # per feature std


def avaliar_modelo_keras(
    model,
    dataset,
    titulo="Avalia√ß√£o do Modelo",
    problem_name="problema",
    max_samples=None,       # None ou <=0 -> usa o m√°ximo poss√≠vel
    n_leads: int = 1,
    save_dir="./resultados/graficos",
    show_plots: bool = True, # üëà se False, apenas salva (sem plt.show)
    preproc=None,            # üëà IGNORADO neste fluxo simplificado
    normalization_method: str | None = None,  # üëà IGNORADO neste fluxo simplificado
    decode_time: bool = True,                 # üëà IGNORADO neste fluxo simplificado
    decode_label: bool = True,                # üëà IGNORADO neste fluxo simplificado
    model_info: dict | None = None,          # üëà IGNORADO neste fluxo simplificado
    run_denorm_decode: bool = False,         # üëà desativado e IGNORADO
    salvar_parquet: bool = False,            # üëà desativado e IGNORADO
):
    """
    Fluxo simplificado (sem denormalizar/decodificar e sem construir DataFrames):
    1) Predict (e evaluate opcional) ‚Üí obt√©m Y_pred e Y_real no estado atual (as-is)
    2) Recorta para max_samples
    3) Calcula m√©tricas diretamente em arrays e gera gr√°ficos
    4) N√ÉO salva datasets (Parquet/CSV) e N√ÉO realiza denormaliza√ß√£o/decodifica√ß√£o
    """
    print(f"üöÄ Avaliando modelo '{model.name}' (sem denorm/decode, sem DFs)...")

    # === Avalia√ß√£o (evaluate) - mantido para registrar m√©tricas de compile ===
    resultados_dict = {}
    try:
        eval_out = model.evaluate(dataset, verbose=0, return_dict=True)
        resultados_dict = {str(k): float(v) for k, v in eval_out.items()}
    except TypeError:
        try:
            resultados = model.evaluate(dataset, verbose=0)
            if not isinstance(resultados, (list, tuple)):
                resultados = [resultados]
            metric_names = getattr(model, "metrics_names", []) or []
            resultados_dict = {str(k): float(v) for k, v in zip(metric_names, resultados)}
        except Exception:
            resultados_dict = {}
    # === Previs√µes ===
    preds, trues = [], []
    for X_batch, Y_batch in dataset:
        p = model.predict(X_batch, verbose=0)
        preds.append(p)
        trues.append(Y_batch)
    Y_pred = np.concatenate(preds, axis=0)
    Y_real = np.concatenate(trues, axis=0)

    Y_pred = np.squeeze(Y_pred)
    Y_real = np.squeeze(Y_real)

    # Limite de amostras
    if max_samples is None or max_samples <= 0 or max_samples > len(Y_real):
        max_samples = len(Y_real)
    print(f"üìè Utilizando {max_samples} amostras para os gr√°ficos.")
    Y_real = Y_real[:max_samples]
    Y_pred = Y_pred[:max_samples]

    # === Diret√≥rio de sa√≠da para imagens/JSON de m√©tricas ===
    output_dir = os.path.join(save_dir, problem_name, model.name)
    if os.path.exists(output_dir):
        print(f"üßπ Limpando diret√≥rio anterior: {output_dir}")
        shutil.rmtree(output_dir)
    os.makedirs(output_dir, exist_ok=True)

    used_scale = 'as-is'

    # === Arrays para m√©tricas/plots (j√° est√£o 'as-is') ===
    Y_real_used = Y_real
    Y_pred_used = Y_pred

    # === M√©tricas gerais (overall) ===
    diff = Y_pred_used - Y_real_used
    abs_diff = np.abs(diff)
    mae_all = float(np.mean(abs_diff))
    mse_all = float(np.mean(diff ** 2))
    rmse_all = float(np.sqrt(mse_all))
    denom = np.where(np.abs(Y_real_used) < 1e-8, np.nan, np.abs(Y_real_used))
    mape_all = float(np.nanmean(abs_diff / denom))
    y_true_flat = Y_real_used.reshape(-1)
    y_pred_flat = Y_pred_used.reshape(-1)
    ss_res = float(np.sum((y_true_flat - y_pred_flat) ** 2))
    ss_tot = float(np.sum((y_true_flat - np.mean(y_true_flat)) ** 2))
    r2_all = float(1.0 - ss_res / ss_tot) if ss_tot > 0 else float('nan')

    resultados_dict["mae"] = mae_all
    resultados_dict["mse"] = mse_all
    resultados_dict["rmse"] = rmse_all
    resultados_dict["mape"] = mape_all
    resultados_dict["r2"] = r2_all
    resultados_dict["used_scale"] = used_scale

    # Persistir m√©tricas JSON (permanece permitido)
    try:
        import json
        with open(os.path.join(output_dir, "metrics.json"), "w", encoding="utf-8") as f:
            json.dump(resultados_dict, f, ensure_ascii=False, indent=2)
        print(f"üíæ metrics.json salvo em: {os.path.join(output_dir, 'metrics.json')}")
    except Exception as e:
        print(f"[WARN] Falha ao salvar metrics.json: {e}")

    # === Tabela de m√©tricas gerais (overall_metrics.png) ===
    numeric_items = [(k, v) for k, v in resultados_dict.items() if isinstance(v, (int, float))]
    if numeric_items:
        fig, ax = plt.subplots(figsize=(8, 0.4 * len(numeric_items) + 1))
        ax.axis('off')
        col_labels = ["M√©trica", "Valor"]
        table_data = [[k, f"{v:.6f}"] for k, v in numeric_items]
        table = ax.table(cellText=table_data, colLabels=col_labels, loc='center')
        table.auto_set_font_size(False)
        table.set_fontsize(9)
        table.scale(1, 1.1)
        ax.set_title(f"{titulo} ‚Äî M√©tricas Gerais ({used_scale})", pad=12)
        overall_path = os.path.join(output_dir, "overall_metrics.png")
        plt.tight_layout()
        plt.savefig(overall_path, dpi=150)
        if show_plots:
            plt.show()
        else:
            plt.close()
        print(f"üíæ Tabela de m√©tricas gerais salva em: {overall_path}\n")

    # === M√©tricas por lead + gr√°ficos comparativos ===
    per_lead_metrics = {}
    if isinstance(Y_real_used, np.ndarray) and Y_real_used.ndim > 1:
        effective_leads = min(Y_real_used.shape[1], n_leads)
        for i in range(effective_leads):
            y_t = Y_real_used[:, i]
            y_p = Y_pred_used[:, i]
            d = y_p - y_t
            ad = np.abs(d)
            mae_i = float(np.mean(ad))
            mse_i = float(np.mean(d ** 2))
            rmse_i = float(np.sqrt(mse_i))
            denom_i = np.where(np.abs(y_t) < 1e-8, np.nan, np.abs(y_t))
            mape_i = float(np.nanmean(ad / denom_i))
            ss_res_i = float(np.sum((y_t - y_p) ** 2))
            ss_tot_i = float(np.sum((y_t - np.mean(y_t)) ** 2))
            r2_i = float(1.0 - ss_res_i / ss_tot_i) if ss_tot_i > 0 else float('nan')
            per_lead_metrics.setdefault('mae', []).append(mae_i)
            per_lead_metrics.setdefault('mse', []).append(mse_i)
            per_lead_metrics.setdefault('rmse', []).append(rmse_i)
            per_lead_metrics.setdefault('mape', []).append(mape_i)
            per_lead_metrics.setdefault('r2', []).append(r2_i)

        # Gera gr√°fico comparativo para cada m√©trica
        def _plot_metric_series(metric_name, values):
            fig, ax = plt.subplots(figsize=(9, 4))
            xs = np.arange(1, len(values) + 1)
            ax.plot(xs, values, marker='o', linewidth=2, color='steelblue')
            ax.set_title(f"{titulo} ‚Äî {metric_name.upper()} por Lead ({used_scale})")
            ax.set_xlabel("Lead")
            ax.set_ylabel(metric_name.upper())
            ax.grid(True, linestyle='--', alpha=0.6)
            for x, v in zip(xs, values):
                ax.annotate(f"{v:.4f}", (x, v), textcoords="offset points", xytext=(0, -15), ha='center', fontsize=8, color='darkslategray')
            plt.tight_layout()
            fpath = os.path.join(output_dir, f"metric_lead_comparison_{metric_name}.png")
            plt.savefig(fpath, dpi=150)
            if show_plots:
                plt.show()
            else:
                plt.close()
            print(f"üíæ Gr√°fico comparativo por lead salvo: {fpath}")

        for mname, vals in per_lead_metrics.items():
            _plot_metric_series(mname, vals)

    # === Gr√°ficos Predito vs Real por lead (s√©ries) ===
    if isinstance(Y_real_used, np.ndarray) and Y_real_used.ndim > 1:
        effective_leads_series = min(Y_real_used.shape[1], n_leads)
    else:
        effective_leads_series = 1

    for i in range(effective_leads_series):
        y_true_i = Y_real_used[:, i] if (effective_leads_series > 1) else Y_real_used
        y_pred_i = Y_pred_used[:, i] if (effective_leads_series > 1) else Y_pred_used
        plt.figure(figsize=(9, 5))
        plt.plot(y_true_i, label=f"Real lead {i+1}", color="black", linewidth=2, alpha=0.8)
        plt.plot(y_pred_i, label=f"Previsto lead {i+1}", color="tomato", linewidth=2, alpha=0.8)
        plt.title(f"{titulo} - Lead {i+1} ({used_scale})")
        plt.xlabel("Amostra")
        plt.ylabel("Valor")
        plt.legend()
        plt.grid(True, linestyle="--", alpha=0.6)
        plt.tight_layout()
        file_name = f"predito_vs_real_lead{i+1}.png"
        file_path = os.path.join(output_dir, file_name)
        plt.savefig(file_path, dpi=150)
        if show_plots:
            plt.show()
        else:
            plt.close()
        print(f"üíæ Gr√°fico Lead {i+1} salvo em: {file_path}")

    print("‚úÖ Avalia√ß√£o conclu√≠da.")

    result_payload = dict(resultados_dict)
    result_payload['y_true'] = Y_real_used
    result_payload['y_pred'] = Y_pred_used
    if 'per_lead_metrics' in locals() and per_lead_metrics:
        result_payload['per_lead_metrics'] = per_lead_metrics
    return result_payload

# N1A ‚Äî S√©rie Univariada (seq_len=72, lead=72)


Objetivo
- Prever 24 horas de carga √† frente com janelas de 48 horas de hist√≥rico para um √∫nico pa√≠s.


Artefatos esperados
- Parquet (Linear/MLP): `data/N1A/linear_dataset_{split}.parquet` + `linear_dataset_{split}.meta.json` ‚Üí { x_dim, y_dim }
- Parquet (LSTM): `data/N1A/lstm_dataset_{split}.parquet` + `lstm_dataset_{split}.meta.json` ‚Üí { seq_len=240, lead=72, x_dim, y_dim }


Modelos a comparar
- Linear, MLP, LSTM (Keras) e, opcionalmente, TFT.


M√©tricas e checks
- MAE, RMSE, MAPE.
- Checar: shapes conforme meta.json; aus√™ncia de NaNs; n√∫mero de amostras > 0.


Visualiza√ß√µes sugeridas
- Boxplot de erro por horizonte; barras de MAE por modelo; curva MAE vs horizonte.


Notas
- As variantes A/B s√£o obtidas reduzindo a janela/horizonte efetivos na avalia√ß√£o a partir do dataset base (240/72).
- Padding (se houver) deve usar sentinela fixo para permitir mascaramento e ru√≠do seletivo.

In [9]:
# Carregamento dos dataset N1A (Parquet)

# linear/mlp (iguais)
ds_linear, linear_info = get_problem_df(
    model_type='linear',
    lag=72,
    lead=72,
    country_list=['ES'],
    problem_name='N1A'
)

# lstm
ds_lstm, lstm_info = get_problem_df(
    model_type='lstm',
    lag=72,
    lead=72,
    country_list=['ES'],
    problem_name='N1A'
)

tft
ds_tft, tft_info = get_problem_df(
    model_type='tft',
    lag=72,
    lead=72,
    country_list=['ES'],
    problem_name='N1A'
)

## Avaliando dados

### Avaliando modelo Linear
avaliar_modelo_keras(
    model=linear,
    dataset=ds_linear,
    titulo="Modelo Linear - Problema N1A",
    problem_name="N1A",
    n_leads=72,
    max_samples=1000,
    show_plots=False,
    preproc=preprocessors['linear'],
    model_info=linear_info,           
    run_denorm_decode=True,           
    salvar_parquet=True               
)

### Avaliando modelo MLP
avaliar_modelo_keras(
    model=mlp,
    dataset=ds_linear,
    titulo="Modelo MLP - Problema N1A",
    problem_name="N1A",
    n_leads=72,
    max_samples=1000,
    show_plots=False,
    preproc=preprocessors['mlp'],
    model_info=linear_info,           
    run_denorm_decode=True,           
    salvar_parquet=True               
)

### Avaliando modelo LSTM
avaliar_modelo_keras(
    model=lstm,
    dataset=ds_lstm,
    titulo="Modelo lstm - Problema N1A",
    problem_name="N1A",
    n_leads=72,
    max_samples=1000,
    show_plots=False,
    preproc=preprocessors['lstm'],
    model_info=linear_info,           
    run_denorm_decode=True,           
    salvar_parquet=True               
)

### Avaliando modelo TFT
avaliar_modelo_keras(
    model=tft,
    dataset=ds_tft,
    titulo="Modelo TFT - Problema N1A",
    problem_name="N1A",
    n_leads=72,
    max_samples=1000,
    show_plots=False,
    preproc=preprocessors['tft'],
    model_info=linear_info,           
    run_denorm_decode=True,           
    salvar_parquet=True               
)

üíæ Gr√°fico Lead 66 salvo em: ./resultados/graficos/N1A/linear_model/predito_vs_real_lead66.png
üíæ Gr√°fico Lead 67 salvo em: ./resultados/graficos/N1A/linear_model/predito_vs_real_lead67.png
üíæ Gr√°fico Lead 68 salvo em: ./resultados/graficos/N1A/linear_model/predito_vs_real_lead68.png
üíæ Gr√°fico Lead 69 salvo em: ./resultados/graficos/N1A/linear_model/predito_vs_real_lead69.png
üíæ Gr√°fico Lead 70 salvo em: ./resultados/graficos/N1A/linear_model/predito_vs_real_lead70.png
üíæ Gr√°fico Lead 71 salvo em: ./resultados/graficos/N1A/linear_model/predito_vs_real_lead71.png
üíæ Gr√°fico Lead 72 salvo em: ./resultados/graficos/N1A/linear_model/predito_vs_real_lead72.png
‚úÖ Avalia√ß√£o conclu√≠da.
üöÄ Avaliando modelo 'mlp_selu' (sem denorm/decode, sem DFs)...


KeyboardInterrupt: 

# N1B ‚Äî S√©rie Univariada (seq_len=168, lead=48)


Objetivo
- Prever 48 horas de carga √† frente com janelas de 168 horas de hist√≥rico para um √∫nico pa√≠s.


Artefatos esperados
- Parquet (Linear/MLP): `data/N1B/linear_dataset_{split}.parquet` + meta { x_dim, y_dim }
- Parquet (LSTM): `data/N1B/lstm_dataset_{split}.parquet` + meta { seq_len=240, lead=72, x_dim, y_dim }
- TFT (opcional): `data/treinamento/tft_dataset_{split}.parquet`


Modelos a comparar
- Linear, MLP, LSTM, TFT (opcional).


M√©tricas e checks
- MAE, RMSE, MAPE; valida√ß√£o de shapes e aus√™ncia de NaNs.


Visualiza√ß√µes sugeridas
- Barras de MAE m√©dio por modelo; curva de erro por horizonte.


Notas
- As variantes A/B s√£o derivadas do dataset base (240/72) reduzindo janela/horizonte na avalia√ß√£o, sem retreinar.

# N1C ‚Äî S√©rie Univariada (seq_len=240, lead=72)


Objetivo
- Pr√©-treino/treino com a janela de 240 horas e avaliar horizonte de 72 horas.


Artefatos esperados
- Parquet (Linear/MLP): `data/N1C/linear_dataset_{split}.parquet` + meta { x_dim, y_dim }
- Parquet (LSTM): `data/N1C/lstm_dataset_{split}.parquet` + meta { seq_len=240, lead=72, x_dim, y_dim }
- TFT (opcional): `data/treinamento/tft_dataset_{split}.parquet`


Modelos a comparar
- Linear, MLP, LSTM, TFT (opcional).


M√©tricas e checks
- MAE, RMSE, MAPE; n√∫mero de amostras por split; coer√™ncia entre seq_len/lead do meta e shapes efetivos.


Visualiza√ß√µes sugeridas
- Curva comparativa de MAE vs horizonte; top‚Äëk modelos por MAE.


Notas
- Esta variante (C) √© a base m√°xima de lookback e horizonte; A/B s√£o obtidas por redu√ß√£o na avalia√ß√£o.

# N2A ‚Äî M√∫ltiplos Pa√≠ses (seq_len=72, lead=24)


Objetivo
- Prever 24 horas com 72 horas de hist√≥rico, agrupando por pa√≠s.


Artefatos esperados
- Parquet (Linear/MLP): `data/N2A/linear_dataset_{split}.parquet` + meta
- Parquet (LSTM): `data/N2A/lstm_dataset_{split}.parquet` + meta { seq_len=240, lead=72, x_dim, y_dim }
- TFT (recomendado): `data/treinamento/tft_dataset_{split}.parquet` (colunas: _group_id=country, time_idx crescente por grupo, quantity_MW)


Modelos a comparar
- Linear, MLP, LSTM (podem exigir codifica√ß√£o/flatten por grupo);
- TFT (nativamente multi‚Äëgrupo).


M√©tricas e checks
- MAE/RMSE por pa√≠s e globais; n√∫mero de grupos; equil√≠brio de amostras por grupo.


Visualiza√ß√µes sugeridas
- Barras de MAE por modelo; facetas por pa√≠s; curva MAE vs horizonte.


Notas
- As variantes A/B/C partem do dataset base (240/72), aplicando janelas/horizontes reduzidos na avalia√ß√£o.

# N2B ‚Äî M√∫ltiplos Pa√≠ses (seq_len=168, lead=48)


Objetivo
- Prever 48 horas com 168 horas de hist√≥rico, agrupado por pa√≠s.


Artefatos esperados
- Parquet (Linear/MLP): `data/N2B/linear_dataset_{split}.parquet` + meta
- Parquet (LSTM): `data/N2B/lstm_dataset_{split}.parquet` + meta { seq_len=240, lead=72, x_dim, y_dim }
- TFT (recomendado): `data/treinamento/tft_dataset_{split}.parquet` com `_group_id`, `time_idx`, target.


Modelos a comparar
- Linear, MLP, LSTM; TFT.


M√©tricas e checks
- MAE/RMSE por pa√≠s e agregadas; distribui√ß√£o de amostras por grupo.


Visualiza√ß√µes sugeridas
- Barras de MAE por modelo; linhas por horizonte; painel por pa√≠s.


Notas
- Variantes A/B/C usam janelas/horizontes efetivos na avalia√ß√£o; base: 240/72.

# N2C ‚Äî M√∫ltiplos Pa√≠ses (seq_len=240, lead=72)


Objetivo
- Prever 72 horas com 240 horas de hist√≥rico, agrupado por pa√≠s. Esta variante √© a base para reuso em A/B.


Artefatos esperados
- Parquet (Linear/MLP): `data/N2C/linear_dataset_{split}.parquet` + meta
- Parquet (LSTM): `data/N2C/lstm_dataset_{split}.parquet` + meta { seq_len=240, lead=72, x_dim, y_dim }
- TFT (recomendado): `data/treinamento/tft_dataset_{split}.parquet` (agrupado por `_group_id`).


Modelos a comparar
- Linear, MLP, LSTM, TFT.


M√©tricas e checks
- MAE, RMSE, MAPE; compara√ß√£o por pa√≠s; checagem de time_idx e integridade por grupo.


Visualiza√ß√µes sugeridas
- Curva MAE vs horizonte; ranking de modelos por pa√≠s e global.


Notas
- Base usa seq_len=240 e lead=72; varia√ß√µes A/B podem ser avaliadas reduzindo janela no dataset sem retreino.

# N3 ‚Äî Robustez a Ru√≠do (sobre N2)

Objetivo
- Medir degrada√ß√£o de desempenho sob ru√≠do gaussiano nas FEATURES (teste), mantendo r√≥tulos intactos.

Configura√ß√£o
- Conjuntos: use os datasets do N2 (A/B/C).
- Intensidades: œÉ ‚àà {0.00, 0.01, 0.03, 0.05, 0.10}.
- Aplica√ß√£o:
  - Keras/tf.data: `add_noise_features(ds, sigma, tipo='tfdata', pad_sentinel=-999.0)`.
  - TFT: `add_noise_features(tft_ds ou dataloader, sigma, tipo='tft', batch_size=..., train=False)`.

M√©tricas e checks
- MAE/RMSE por sigma; checar preserva√ß√£o de sentinela (TF) e invari√¢ncia de Y.

Visualiza√ß√µes sugeridas
- Curvas MAE vs œÉ por modelo; heatmap de degrada√ß√£o por horizonte e sigma.

Notas
- Aplique ru√≠do ap√≥s normaliza√ß√£o das features.
- N√£o altere o treino; apenas avalia√ß√£o/benchmark.
