In [1]:
import requests
import pandas as pd
from datetime import datetime, timedelta
import os


import logging

# Configuração básica de logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- 1. CONFIGURAÇÕES E PARÂMETROS ---
CODIGO_ESTACAO_INMET = "A701"
DATA_FIM = datetime.now().replace(minute=0, second=0, microsecond=0) # Alinhando para hora cheia
DATA_INICIO = DATA_FIM - timedelta(days=30) 

OUTPUT_DIR = "dados_projeto_hpo"
if not os.path.exists(OUTPUT_DIR):
    os.makedirs(OUTPUT_DIR)

# --- 2. EXTRAÇÃO (E) ---

def extrair_dados_inmet(codigo_estacao: str, data_inicio: datetime, data_fim: datetime) -> pd.DataFrame:
    """
    Extrai dados do INMET. Em caso de falha da API real (404),
    retorna um DataFrame simulado com as colunas esperadas.
    """
    logging.info(f"Iniciando Extração de dados do INMET para estação: {codigo_estacao}")
    
    # URL da API do INMET (Endpoint conceitual)
    URL_API = f"https://apitempo.inmet.gov.br/dados/horarios/{codigo_estacao}" 
    dados = []
    
    try:
        response = requests.get(URL_API, timeout=15)
        response.raise_for_status() 
        dados = response.json()
        
    except requests.exceptions.RequestException as e:
        logging.error(f"Erro na extração do INMET: {e}. Usando simulação para continuar o ETL.")
        
        # --- CORREÇÃO APLICADA AQUI ---
        # Garantindo que os dados simulados tenham as CHAVES/COLUNAS que a função 'transformar_dados' espera.
        horas = pd.date_range(end=DATA_FIM, periods=720, freq='h')
        dados = []
        for dt in horas:
             # Simulando o formato de saída que a API real usaria (para ser tratado na Transformação)
             dados.append({
                 "DT_MEDICAO": dt.strftime("%Y-%m-%d"),
                 "HR_MEDICAO": dt.strftime("%H%M"), # Exemplo: 1500
                 "CHUVA": dt.hour % 3,             # Simulação de chuva
                 "TEMP_BULB_SECO": 20.0 + (dt.hour % 10) # Simulação de temperatura
             })

    df = pd.DataFrame(dados)
    logging.info(f"Extração do INMET concluída. {len(df)} registros encontrados (reais ou simulados).")
    return df

def extrair_dados_ons_ccee(fonte: str) -> pd.DataFrame:
    """Placeholder para extração de ONS/CCEE (Geração e Carga), agora usando 'h'."""
    logging.info(f"Extração de {fonte} exige Web Scraping ou download manual de arquivos.")
    logging.warning(f"Usando dados fictícios de {fonte} para simulação de Big Data.")
    
    # Corrigindo 'H' deprecated para 'h'
    datas = pd.date_range(end=DATA_FIM, periods=720, freq='h') 
    if fonte == 'ONS':
        return pd.DataFrame({
            'timestamp': datas,
            'carga_mw_subsistema': [25000 + i % 1000 for i in range(len(datas))],
            'frequencia_hz': [60.0 + (i % 5) / 100 for i in range(len(datas))]
        })
    else: 
        return pd.DataFrame({
            'timestamp': datas,
            'geracao_eolica_mw': [500 + i % 500 for i in range(len(datas))],
            'restricao_vazao': [1 if i % 100 == 0 else 0 for i in range(len(datas))]
        })

# --- 3. TRANSFORMAÇÃO (T) ---

def transformar_dados(df_inmet: pd.DataFrame, df_ons: pd.DataFrame, df_ccee: pd.DataFrame) -> pd.DataFrame:
    """Realiza a limpeza, unificação e Engenharia de Features."""
    logging.info("Iniciando Transformação e Engenharia de Features.")

    # 3.1. Tratamento e Unificação do INMET
    # A lógica aqui espera CHAVES da API real ou da SIMULAÇÃO corrigida.
    df_inmet['timestamp'] = pd.to_datetime(
        df_inmet['DT_MEDICAO'] + ' ' + df_inmet['HR_MEDICAO'].str.slice(0, 2) + ':00:00',
        format='%Y-%m-%d %H:%M:%S', errors='coerce'
    )
    
    # Assegurando que as colunas críticas existam e tratando NaNs
    colunas_inmet = ['timestamp', 'CHUVA', 'TEMP_BULB_SECO']
    df_inmet = df_inmet[colunas_inmet].dropna().set_index('timestamp')
    df_inmet = df_inmet.astype({'CHUVA': 'float64', 'TEMP_BULB_SECO': 'float64'})
    logging.info("Dados do INMET tratados.")

    # 3.2. Unificação (Big Data: Mesclagem de Fontes)
    df_final = pd.merge(df_ons.set_index('timestamp'), df_ccee.set_index('timestamp'),
                        left_index=True, right_index=True, how='inner')
    df_final = pd.merge(df_final, df_inmet, left_index=True, right_index=True, how='left')
    
    # 3.3. Engenharia de Features
    df_final['carga_lag_24h'] = df_final['carga_mw_subsistema'].shift(24) 
    df_final['alerta_intermitente'] = (df_final['geracao_eolica_mw'] > 800).astype(int) 

    logging.info(f"Transformação concluída. Dataset final (Big Data) com {len(df_final)} linhas.")
    return df_final.reset_index()

# --- 4. CARGA (L) ---

def carregar_dados(df_final: pd.DataFrame, nome_arquivo: str):
    """Carrega os dados tratados para um arquivo CSV e simula carga em um BD."""
    caminho_csv = os.path.join(OUTPUT_DIR, nome_arquivo)
    df_final.to_csv(caminho_csv, index=False)
    logging.info(f"Dados carregados para CSV: {caminho_csv}")
    logging.info("Simulação de Carga concluída. Pronto para Modelagem/Deploy (TensorFlow/PyTorch).")


# --- 5. EXECUÇÃO PRINCIPAL ---

if __name__ == "__main__":
    # 1. Extração
    dados_inmet = extrair_dados_inmet(CODIGO_ESTACAO_INMET, DATA_INICIO, DATA_FIM)
    dados_ons = extrair_dados_ons_ccee('ONS')
    dados_ccee = extrair_dados_ons_ccee('CCEE')

    if dados_ons.empty or dados_ccee.empty:
        logging.error("Extração simulada falhou. Verifique as funções de extração.")
    else:
        # 2. Transformação (Criação do Big Data Unificado)
        dataset_hpo = transformar_dados(dados_inmet, dados_ons, dados_ccee)
        
        # 3. Carga
        carregar_dados(dataset_hpo, f"dados_hpo_integrados_{DATA_FIM.strftime('%Y%m%d')}.csv")

        # Exibe as primeiras linhas do Big Data unificado
        print("\n--- Amostra do Dataset Integrado (Big Data) ---")
        print(dataset_hpo.head())

2025-09-29 15:41:46,291 - INFO - Iniciando Extração de dados do INMET para estação: A701
2025-09-29 15:41:46,491 - ERROR - Erro na extração do INMET: 404 Client Error: Not Found for url: https://apitempo.inmet.gov.br/dados/horarios/A701. Usando simulação para continuar o ETL.
2025-09-29 15:41:46,504 - INFO - Extração do INMET concluída. 720 registros encontrados (reais ou simulados).
2025-09-29 15:41:46,505 - INFO - Extração de ONS exige Web Scraping ou download manual de arquivos.
2025-09-29 15:41:46,510 - INFO - Extração de CCEE exige Web Scraping ou download manual de arquivos.
2025-09-29 15:41:46,513 - INFO - Iniciando Transformação e Engenharia de Features.
2025-09-29 15:41:46,527 - INFO - Dados do INMET tratados.
2025-09-29 15:41:46,535 - INFO - Transformação concluída. Dataset final (Big Data) com 720 linhas.
2025-09-29 15:41:46,547 - INFO - Dados carregados para CSV: dados_projeto_hpo\dados_hpo_integrados_20250929.csv
2025-09-29 15:41:46,547 - INFO - Simulação de Carga concluíd


--- Amostra do Dataset Integrado (Big Data) ---
            timestamp  carga_mw_subsistema  frequencia_hz  geracao_eolica_mw  \
0 2025-08-30 16:00:00                25000          60.00                500   
1 2025-08-30 17:00:00                25001          60.01                501   
2 2025-08-30 18:00:00                25002          60.02                502   
3 2025-08-30 19:00:00                25003          60.03                503   
4 2025-08-30 20:00:00                25004          60.04                504   

   restricao_vazao  CHUVA  TEMP_BULB_SECO  carga_lag_24h  alerta_intermitente  
0                1    1.0            26.0            NaN                    0  
1                0    2.0            27.0            NaN                    0  
2                0    0.0            28.0            NaN                    0  
3                0    1.0            29.0            NaN                    0  
4                0    2.0            20.0            NaN              

In [2]:
import pandas as pd
import logging
import os

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- DEFINA O CAMINHO COMPLETO DO ARQUIVO AQUI ---
# Este caminho DEVE apontar diretamente para o arquivo CSV.
FILE_PATH = r"C:\Users\lostj\Documents\Data\projects\Integrated Predictive System for Maximizing Operational Efficiency\dados_projeto_hpo\dados_hpo_integrados_20250926.csv"

def read_integrated_data(file_path: str) -> pd.DataFrame:
    """
    Lê o arquivo CSV unificado e realiza a conversão essencial de tipos de dados.
    
    Args:
        file_path: Caminho completo para o arquivo CSV integrado.

    Returns:
        Um DataFrame do Pandas com a coluna de timestamp convertida.
    """
    if not os.path.exists(file_path):
        logging.error(f"Erro: Arquivo não encontrado no caminho: {file_path}")
        return pd.DataFrame()

    logging.info(f"Iniciando leitura do arquivo integrado: {os.path.basename(file_path)}")
    
    try:
        # 1. Leitura do CSV
        df = pd.read_csv(file_path, low_memory=False)
        
        # 2. Conversão de Tipos (Essencial para Séries Temporais)
        # Converte a coluna 'timestamp' para o tipo datetime, crucial para a modelagem LSTM.
        df['timestamp'] = pd.to_datetime(df['timestamp'], errors='coerce')
        
        # Remove linhas com timestamp inválido, caso haja
        df = df.dropna(subset=['timestamp'])

        logging.info(f"Leitura concluída. Dataset com {len(df)} linhas.")
        return df

    except Exception as e:
        logging.error(f"Ocorreu um erro ao processar o arquivo CSV: {e}")
        return pd.DataFrame()

# --- EXECUÇÃO PRINCIPAL ---

if __name__ == "__main__":
    integrated_data = read_integrated_data(FILE_PATH)
    
    if not integrated_data.empty:
        print("\n--- Amostra do Big Data Integrado (Pronto para ML) ---")
        print(integrated_data.head())
        
        # Confirma que a coluna 'timestamp' foi corretamente convertida
        print(f"\nTipo de dado da coluna 'timestamp' agora é: {integrated_data['timestamp'].dtype}")
        
        # Próximo passo: Análise Exploratória de Dados (EDA) e Modelagem Preditiva.

2025-09-29 15:41:46,564 - INFO - Iniciando leitura do arquivo integrado: dados_hpo_integrados_20250926.csv
2025-09-29 15:41:46,575 - INFO - Leitura concluída. Dataset com 720 linhas.



--- Amostra do Big Data Integrado (Pronto para ML) ---
            timestamp  carga_mw_subsistema  frequencia_hz  geracao_eolica_mw  \
0 2025-08-27 14:00:00                25000          60.00                500   
1 2025-08-27 15:00:00                25001          60.01                501   
2 2025-08-27 16:00:00                25002          60.02                502   
3 2025-08-27 17:00:00                25003          60.03                503   
4 2025-08-27 18:00:00                25004          60.04                504   

   restricao_vazao  CHUVA  TEMP_BULB_SECO  carga_lag_24h  alerta_intermitente  
0                1    2.0            24.0            NaN                    0  
1                0    0.0            25.0            NaN                    0  
2                0    1.0            26.0            NaN                    0  
3                0    2.0            27.0            NaN                    0  
4                0    0.0            28.0            NaN       

In [3]:
pip install tensorflow

Note: you may need to restart the kernel to use updated packages.


In [4]:
conda install tensorflow


Note: you may need to restart the kernel to use updated packages.Jupyter detected...
3 channel Terms of Service accepted
Channels:
 - defaults
Platform: win-64
Collecting package metadata (repodata.json): done
Solving environment: failed




LibMambaUnsatisfiableError: Encountered problems while solving:
  - nothing provides bleach 1.5.0 needed by tensorboard-1.7.0-py35he025d50_1

Could not solve for environment specs
The following packages are incompatible
\u251c\u2500 [32mpin on python 3.13.* =* *[0m is installable and it requires
\u2502  \u2514\u2500 [32mpython =3.13 *[0m, which can be installed;
\u2514\u2500 [31mtensorflow =* *[0m is not installable because there are no viable options
   \u251c\u2500 [31mtensorflow [1.10.0|1.9.0][0m would require
   \u2502  \u2514\u2500 [31mpython =3.5 *[0m, which conflicts with any installable versions previously reported;
   \u251c\u2500 [31mtensorflow [1.10.0|1.11.0|...|2.1.0][0m would require
   \u2502  \u2514\u2500 [31mpython =3.6 *[0m, which conflicts with any installable versions previously reported;
   \u251c\u2500 [31mtensorflow [1.13.1|1.14.0|...|2.9.1][0m would require
   \u2502  \u2514\u2500 [31mpython =3.7 *[0m, which conflicts with any installable versi

In [5]:
pip install tensorflow[and-cuda]

Collecting nvidia-cublas-cu12<13.0,>=12.5.3.2 (from tensorflow[and-cuda])
  Using cached nvidia_cublas_cu12-12.9.1.4-py3-none-win_amd64.whl.metadata (1.7 kB)
Collecting nvidia-cuda-cupti-cu12<13.0,>=12.5.82 (from tensorflow[and-cuda])
  Using cached nvidia_cuda_cupti_cu12-12.9.79-py3-none-win_amd64.whl.metadata (1.8 kB)
Collecting nvidia-cuda-nvcc-cu12<13.0,>=12.5.82 (from tensorflow[and-cuda])
  Using cached nvidia_cuda_nvcc_cu12-12.9.86-py3-none-win_amd64.whl.metadata (1.7 kB)
Collecting nvidia-cuda-nvrtc-cu12<13.0,>=12.5.82 (from tensorflow[and-cuda])
  Using cached nvidia_cuda_nvrtc_cu12-12.9.86-py3-none-win_amd64.whl.metadata (1.7 kB)
Collecting nvidia-cuda-runtime-cu12<13.0,>=12.5.82 (from tensorflow[and-cuda])
  Using cached nvidia_cuda_runtime_cu12-12.9.79-py3-none-win_amd64.whl.metadata (1.7 kB)
Collecting nvidia-cudnn-cu12<10.0,>=9.3.0.75 (from tensorflow[and-cuda])
  Using cached nvidia_cudnn_cu12-9.13.1.26-py3-none-win_amd64.whl.metadata (1.8 kB)
Collecting nvidia-cufft-cu1

ERROR: Could not find a version that satisfies the requirement nvidia-nccl-cu12<3.0,>=2.25.1; extra == "and-cuda" (from tensorflow[and-cuda]) (from versions: 0.0.1.dev5)
ERROR: No matching distribution found for nvidia-nccl-cu12<3.0,>=2.25.1; extra == "and-cuda"


In [6]:
import tensorflow as tf
print(tf.__version__)

2.20.0


In [7]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
import logging
import os

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- DEFINA O CAMINHO DO ARQUIVO ---
# Use o caminho confirmado onde o seu CSV integrado está.
FILE_PATH = r"C:\Users\lostj\Documents\Data\projects\Integrated Predictive System for Maximizing Operational Efficiency\dados_projeto_hpo\dados_hpo_integrados_20250926.csv"

# Variáveis que o modelo preditivo irá utilizar
FEATURES = [
    'carga_mw_subsistema', 'frequencia_hz', 'geracao_eolica_mw',
    'restricao_vazao', 'CHUVA', 'TEMP_BULB_SECO', 'carga_lag_24h'
]
TARGET = 'carga_mw_subsistema'  # O que queremos prever

# Parâmetros de Série Temporal
TIME_STEPS = 24  # Usar as últimas 24 horas para prever a próxima
PREDICT_HORIZON = 1 # Prever a próxima hora

def load_and_preprocess_for_lstm(file_path: str, features: list, target: str, time_steps: int):
    """Carrega, limpa, normaliza e transforma os dados em sequências LSTM."""
    try:
        df = pd.read_csv(file_path, low_memory=False)
        df['timestamp'] = pd.to_datetime(df['timestamp'], errors='coerce')
        df = df.dropna(subset=['timestamp']).set_index('timestamp').sort_index()

        # 1. Seleção e Limpeza Final
        df = df[features].dropna()
        
        # 2. Normalização (Essencial para Deep Learning)
        scaler = MinMaxScaler(feature_range=(0, 1))
        scaled_data = scaler.fit_transform(df)
        
        # 3. Transformação em Sequências (Time-Series Formatting)
        X, y = [], []
        for i in range(len(scaled_data) - time_steps - PREDICT_HORIZON + 1):
            # Sequência de entrada (24 horas)
            X.append(scaled_data[i:(i + time_steps)])
            # Valor alvo (a carga da hora seguinte)
            target_index = df.columns.get_loc(target)
            y.append(scaled_data[i + time_steps, target_index])
            
        X = np.array(X)
        y = np.array(y)
        
        logging.info(f"Dados prontos para LSTM. X_shape: {X.shape}, y_shape: {y.shape}")
        
        # Guardar o scaler para desnormalizar as previsões futuras (crucial)
        return X, y, scaler
    
    except Exception as e:
        logging.error(f"Erro na preparação dos dados para LSTM: {e}")
        return None, None, None

# --- 2. MODELAGEM PREDITIVA (LSTM) ---

def create_and_train_lstm_model(X, y):
    """Cria e treina um modelo LSTM simples."""
    logging.info("Iniciando construção e treino do modelo LSTM.")
    
    # Divisão simples em treino e teste (80/20)
    train_size = int(len(X) * 0.8)
    X_train, X_test = X[:train_size], X[train_size:]
    y_train, y_test = y[:train_size], y[train_size:]

    # Definição do Modelo (Inspirado no seu uso de TensorFlow/PyTorch)
    model = Sequential()
    model.add(LSTM(units=50, return_sequences=False, input_shape=(X_train.shape[1], X_train.shape[2])))
    model.add(Dense(units=1)) # Apenas uma saída: a carga prevista
    
    # Compilação e Treino
    model.compile(optimizer='adam', loss='mean_squared_error')
    
    # Treinamento com uma época rápida para simulação
    model.fit(X_train, y_train, epochs=1, batch_size=1, verbose=1, validation_data=(X_test, y_test))
    
    logging.info("Treinamento concluído.")
    return model

# --- 3. INTEGRAÇÃO E OTIMIZAÇÃO CONCEITUAL ---

def conceptual_optimization(model, X_new, scaler):
    """
    Simula a previsão e o passo conceitual para Otimização da Curva Horária.
    Isto é o coração do HPO: usar a previsão para guiar a operação.
    """
    logging.info("Iniciando a Simulação de Previsão e Otimização.")
    
    # 1. Previsão
    predicted_scaled = model.predict(X_new)
    
    # 2. Desnormalização da Previsão (Crucial)
    # Criamos uma matriz temporária para desnormalizar apenas o valor da carga (TARGET)
    dummy_array = np.zeros((len(predicted_scaled), len(FEATURES)))
    target_index = FEATURES.index(TARGET)
    dummy_array[:, target_index] = predicted_scaled.flatten()
    
    # Desnormaliza o valor previsto (agora está em MW)
    predicted_mw = scaler.inverse_transform(dummy_array)[:, target_index]
    
    # 3. Ponto de Decisão (Otimização da Curva Horária)
    forecast_time = pd.to_datetime(integrated_data.index[-1] + timedelta(hours=1))
    
    logging.info(f"Previsão de Carga para {forecast_time}: {predicted_mw[0]:.2f} MW")
    
    # ** Conceito de Otimização (Programação Linear): **
    # Se a previsão for alta (acima de 25500 MW), o sistema precisa de mais estabilidade
    PREDICTED_LOAD = predicted_mw[0]
    MIN_HYDRO_REQUIRED = 500 # Geração mínima obrigatória (Restrição Operacional)
    MAX_HYDRO_CAPACITY = 1200 # Capacidade máxima da hidrelétrica
    
    if PREDICTED_LOAD > 25500:
        # A Otimização (algoritmo) sugeriria o despacho ideal:
        SUGGESTED_DISPATCH = min(MAX_HYDRO_CAPACITY, MIN_HYDRO_REQUIRED + 300) 
        logging.warning(f"Carga prevista alta. Sugestão de Despacho (Otimizado): {SUGGESTED_DISPATCH} MW.")
    else:
        SUGGESTED_DISPATCH = MIN_HYDRO_REQUIRED
        logging.info(f"Carga prevista normal. Sugestão de Despacho (Otimizado): {SUGGESTED_DISPATCH} MW.")
        
    logging.info("O modelo preditivo agora guia a Otimização da Curva Horária, respeitando as Restrições.")


# --- EXECUÇÃO PRINCIPAL ---

if __name__ == "__main__":
    X, y, scaler = load_and_preprocess_for_lstm(FILE_PATH, FEATURES, TARGET, TIME_STEPS)
    
    if X is not None:
        # Treinamento do modelo
        model = create_and_train_lstm_model(X, y)
        
        # Previsão para a próxima hora
        # Pega a última sequência de tempo para fazer a previsão
        X_new = X[-1].reshape(1, TIME_STEPS, len(FEATURES))
        
        # Simulação do HPO: Previsão + Otimização
        integrated_data = pd.read_csv(FILE_PATH, low_memory=False)
        integrated_data['timestamp'] = pd.to_datetime(integrated_data['timestamp'], errors='coerce')
        integrated_data = integrated_data.dropna(subset=['timestamp']).set_index('timestamp').sort_index()

        conceptual_optimization(model, X_new, scaler)

2025-09-29 15:43:05,240 - INFO - Dados prontos para LSTM. X_shape: (672, 24, 7), y_shape: (672,)
2025-09-29 15:43:05,241 - INFO - Iniciando construção e treino do modelo LSTM.
  super().__init__(**kwargs)


[1m537/537[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 4ms/step - loss: 0.0026 - val_loss: 5.5474e-04


2025-09-29 15:43:08,834 - INFO - Treinamento concluído.
2025-09-29 15:43:08,840 - INFO - Iniciando a Simulação de Previsão e Otimização.


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 142ms/step


2025-09-29 15:43:09,022 - INFO - Previsão de Carga para 2025-09-26 14:00:00: 25690.88 MW
2025-09-29 15:43:09,023 - INFO - O modelo preditivo agora guia a Otimização da Curva Horária, respeitando as Restrições.


In [8]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
import logging
import os

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- DEFINA O CAMINHO DO ARQUIVO ---
FILE_PATH = r"C:\Users\lostj\Documents\Data\projects\Integrated Predictive System for Maximizing Operational Efficiency\dados_projeto_hpo\dados_hpo_integrados_20250926.csv"

# Variáveis que o modelo preditivo irá utilizar
FEATURES = [
    'carga_mw_subsistema', 'frequencia_hz', 'geracao_eolica_mw',
    'restricao_vazao', 'CHUVA', 'TEMP_BULB_SECO', 'carga_lag_24h'
]
TARGET = 'carga_mw_subsistema'  # O que queremos prever
TIME_STEPS = 24  
PREDICT_HORIZON = 1 

# O scaler é um objeto de estado e precisa ser retornado para a desnormalização
global SCALER_GLOBAL
SCALER_GLOBAL = None


# --- 1. PREPARAÇÃO DOS DADOS ---

def load_and_preprocess_for_lstm(file_path: str, features: list, target: str, time_steps: int):
    """Carrega, limpa, normaliza e transforma os dados em sequências LSTM."""
    global SCALER_GLOBAL
    try:
        df = pd.read_csv(file_path, low_memory=False)
        df['timestamp'] = pd.to_datetime(df['timestamp'], errors='coerce')
        df = df.dropna(subset=['timestamp']).set_index('timestamp').sort_index()

        df = df[features].dropna()
        
        # 2. Normalização (Escalonamento)
        scaler = MinMaxScaler(feature_range=(0, 1))
        scaled_data = scaler.fit_transform(df)
        SCALER_GLOBAL = scaler # Salva o scaler globalmente
        
        # 3. Transformação em Sequências
        X, y = [], []
        for i in range(len(scaled_data) - time_steps - PREDICT_HORIZON + 1):
            X.append(scaled_data[i:(i + time_steps)])
            target_index = df.columns.get_loc(target)
            y.append(scaled_data[i + time_steps, target_index])
            
        X = np.array(X)
        y = np.array(y)
        
        logging.info(f"Dados prontos para LSTM. X_shape: {X.shape}, y_shape: {y.shape}")
        
        # 4. Divisão Treino/Teste
        train_size = int(len(X) * 0.8)
        X_train, X_test = X[:train_size], X[train_size:]
        y_train, y_test = y[:train_size], y[train_size:]
        
        return X_train, X_test, y_train, y_test, df # Retorna o DataFrame original para desnormalizar índices
    
    except Exception as e:
        logging.error(f"Erro na preparação dos dados para LSTM: {e}")
        return None, None, None, None, None


# --- 2. MODELAGEM E TREINO ---

def create_and_train_lstm_model(X_train, y_train, X_test, y_test):
    """Cria e treina um modelo LSTM."""
    logging.info("Iniciando construção e treino do modelo LSTM.")

    model = Sequential()
    model.add(LSTM(units=50, return_sequences=False, input_shape=(X_train.shape[1], X_train.shape[2])))
    model.add(Dense(units=1))
    
    model.compile(optimizer='adam', loss='mean_squared_error')
    
    model.fit(X_train, y_train, epochs=3, batch_size=1, verbose=1, validation_data=(X_test, y_test))
    
    logging.info("Treinamento concluído.")
    return model


# --- 3. VALIDAÇÃO RIGOROSA ---

def rigorous_validation(model, X_test, y_test, df_original):
    """Calcula RMSE e compara Previsões vs. Valores Reais em MW."""
    logging.info("Iniciando Validação Rigorosa (Cálculo de RMSE).")
    
    # 1. Previsão
    predicted_scaled = model.predict(X_test)
    
    # 2. Desnormalização (Voltar para MW)
    global SCALER_GLOBAL
    if SCALER_GLOBAL is None:
        logging.error("Scaler não encontrado. Não é possível desnormalizar.")
        return

    target_index = FEATURES.index(TARGET)
    
    # Função auxiliar para desnormalizar o target
    def inverse_transform_target(scaled_values):
        # Cria um array dummy com zeros e coloca os valores scaled na coluna do target
        dummy_array = np.zeros((len(scaled_values), len(FEATURES)))
        dummy_array[:, target_index] = scaled_values.flatten()
        # Desnormaliza o array completo e pega apenas a coluna do target
        return SCALER_GLOBAL.inverse_transform(dummy_array)[:, target_index]

    y_predicted_mw = inverse_transform_target(predicted_scaled)
    y_test_mw = inverse_transform_target(y_test)
    
    # 3. Cálculo do RMSE
    rmse = np.sqrt(mean_squared_error(y_test_mw, y_predicted_mw))
    
    logging.info(f"RMSE (Root Mean Squared Error) no Test Set: {rmse:.2f} MW")

    # 4. Análise de Comparação (Visualização de Desempenho)
    validation_df = pd.DataFrame({
        'Real (MW)': y_test_mw,
        'Previsto (MW)': y_predicted_mw,
        'Erro Absoluto': np.abs(y_test_mw - y_predicted_mw)
    })
    
    print("\n--- Validação: Previsão vs. Real (Amostra) ---")
    print(validation_df.head(10).round(2))
    print(f"\nO RMSE de {rmse:.2f} MW indica a diferença média de erro de previsão no Test Set.")


# --- EXECUÇÃO PRINCIPAL ---

if __name__ == "__main__":
    X_train, X_test, y_train, y_test, df_original = load_and_preprocess_for_lstm(FILE_PATH, FEATURES, TARGET, TIME_STEPS)
    
    if X_train is not None:
        model = create_and_train_lstm_model(X_train, y_train, X_test, y_test)
        
        # Execução da Validação Rigorosa
        rigorous_validation(model, X_test, y_test, df_original)

2025-09-29 15:43:09,202 - INFO - Dados prontos para LSTM. X_shape: (672, 24, 7), y_shape: (672,)
2025-09-29 15:43:09,202 - INFO - Iniciando construção e treino do modelo LSTM.
  super().__init__(**kwargs)


Epoch 1/3
[1m537/537[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 4ms/step - loss: 0.0026 - val_loss: 2.8667e-04
Epoch 2/3
[1m537/537[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 3ms/step - loss: 1.7231e-04 - val_loss: 4.4829e-04
Epoch 3/3
[1m537/537[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 4ms/step - loss: 9.9311e-05 - val_loss: 1.8030e-04


2025-09-29 15:43:16,210 - INFO - Treinamento concluído.
2025-09-29 15:43:16,210 - INFO - Iniciando Validação Rigorosa (Cálculo de RMSE).


[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step 


2025-09-29 15:43:16,531 - INFO - RMSE (Root Mean Squared Error) no Test Set: 9.33 MW



--- Validação: Previsão vs. Real (Amostra) ---
   Real (MW)  Previsto (MW)  Erro Absoluto
0    25585.0       25583.01           1.99
1    25586.0       25583.87           2.13
2    25587.0       25587.29           0.29
3    25588.0       25588.52           0.52
4    25589.0       25586.41           2.59
5    25590.0       25585.52           4.48
6    25591.0       25591.37           0.37
7    25592.0       25589.44           2.56
8    25593.0       25591.67           1.33
9    25594.0       25592.28           1.72

O RMSE de 9.33 MW indica a diferença média de erro de previsão no Test Set.


In [9]:
pip install pulp

Note: you may need to restart the kernel to use updated packages.


In [10]:
conda all -c conda-forge pulp


Note: you may need to restart the kernel to use updated packages.


usage: conda-script.py [-h] [-v] [--no-plugins] [-V] COMMAND ...
conda-script.py: error: argument COMMAND: invalid choice: 'all' (choose from activate, build, clean, commands, compare, config, content-trust, convert, create, deactivate, debug, develop, doctor, env, export, index, info, init, inspect, install, list, metapackage, notices, pack, package, remove, rename, render, repo, repoquery, run, search, server, skeleton, token, tos, uninstall, update, upgrade)


In [11]:
import pandas as pd
import numpy as np
from pulp import LpProblem, LpMinimize, LpVariable, LpStatus, value
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
import logging
import os

# Supondo que você já executou a instalação: pip install pulp

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- CONFIGURAÇÕES DO SISTEMA HPO ---
FILE_PATH = r"C:\Users\lostj\Documents\Data\projects\Integrated Predictive System for Maximizing Operational Efficiency\dados_projeto_hpo\dados_hpo_integrados_20250926.csv"
FEATURES = ['carga_mw_subsistema', 'frequencia_hz', 'geracao_eolica_mw',
            'restricao_vazao', 'CHUVA', 'TEMP_BULB_SECO', 'carga_lag_24h']
TARGET = 'carga_mw_subsistema' 
TIME_STEPS = 24  
PREDICT_HORIZON = 1 
SCALER_GLOBAL = None

# Parâmetros Operacionais (Restrições)
MIN_GERACAO_OBRIGATORIA = 400.0  # MW (Restrição Ambiental/Operativa)
MAX_GERACAO_CAPACIDADE = 1500.0  # MW (Capacidade Máxima da Usina)


# --- FUNÇÕES LSTM (Adaptadas do Passo Anterior para Reuso) ---

# [Código das funções load_and_preprocess_for_lstm e create_and_train_lstm_model omitido por concisão, 
# mas estas são as funções que fornecem a PREVISÃO (INPUT)]

# NOTA: Para rodar este script, você precisa incluir as funções load_and_preprocess_for_lstm, 
# create_and_train_lstm_model e suas dependências (rigorous_validation) do passo anterior.

# A função de Otimização é a novidade:
def optimization_dispatch(carga_prevista_mw: float, geracao_intermitente_prevista: float):
    """
    Define a Geração Hidrelétrica (G_hidro) ideal através de Programação Linear,
    minimizando o erro de atendimento à carga e respeitando restrições.
    """
    logging.info("\n--- Iniciando Otimização da Curva Horária (PuLP) ---")
    
    # 1. Variáveis do Problema
    # Criar o modelo de minimização
    model = LpProblem("Otimizacao_Despacho_Hidreletrica", LpMinimize)
    
    # Variável de Decisão: Geração da Hidrelétrica (contínua)
    # A geração deve ser ≥ MIN_GERACAO_OBRIGATORIA e ≤ MAX_GERACAO_CAPACIDADE
    G_hidro = LpVariable("G_hidro", 
                         lowBound=MIN_GERACAO_OBRIGATORIA, 
                         upBound=MAX_GERACAO_CAPACIDADE, 
                         cat='Continuous')
    
    # 2. Função Objetivo
    # Objetivo: Minimizar a diferença (erro absoluto) entre a Carga Prevista
    # e a Geração Total (Hidro + Intermitentes).
    
    # NOTA: Usamos a variável de erro 'delta' para linearizar o erro absoluto: |A - B| = delta
    delta_positivo = LpVariable("delta_pos", lowBound=0)
    delta_negativo = LpVariable("delta_neg", lowBound=0)
    
    # Função Objetivo: Minimizar a soma dos desvios (erro)
    model += delta_positivo + delta_negativo, "Minimizar_Erro_Despacho"
    
    # 3. Restrição Principal (Equilíbrio de Carga)
    # Carga Prevista - Geração Total = delta_positivo - delta_negativo
    geracao_total = G_hidro + geracao_intermitente_prevista
    model += (carga_prevista_mw - geracao_total) == (delta_positivo - delta_negativo), "Equilibrio_Carga"
    
    # Restrição Operacional de Vazão (Já embutida no lowBound de G_hidro)
    logging.info(f"Restrição Ativa: G_hidro deve ser entre {MIN_GERACAO_OBRIGATORIA} MW e {MAX_GERACAO_CAPACIDADE} MW.")
    
    # 4. Solução
    model.solve()
    
    # 5. Análise de Resultados
    if LpStatus[model.status] == "Optimal":
        despacho_otimizado = value(G_hidro)
        erro_final = value(delta_positivo + delta_negativo)
        
        logging.warning(f"SUGESTÃO HPO (OTIMIZADA): Despachar {despacho_otimizado:.2f} MW (Hidro)")
        logging.info(f"O Despacho garante um erro de atendimento mínimo de: {erro_final:.2f} MW")
        logging.info(f"Restrição Mínima Obrigatória ({MIN_GERACAO_OBRIGATORIA} MW) respeitada.")
        return despacho_otimizado
    else:
        logging.error("Otimização falhou. Verificar se as restrições são viáveis.")
        return None

# --- EXECUÇÃO PRINCIPAL DA OTIMIZAÇÃO ---

if __name__ == "__main__":
    # --- Passo 1: Configurar a Previsão (Inputs) ---
    
    # Usaremos valores simulados do resultado do LSTM (Seu resultado de 25700.21 MW)
    CARGA_PREVISTA_MW = 25700.21 
    
    # A Geração Eólica/Solar Prevista (valor que o seu modelo de Gêmeo Digital/LSTM também preveria)
    # Vamos simular uma geração intermitente de 24000 MW (valor alto, exigindo pouca hidro)
    GERACAO_INTERMITENTE_PREVISTA = 24500.0 
    
    # Demanda remanescente que a Hidro precisa cobrir:
    DEMANDA_REMANESCENTE = CARGA_PREVISTA_MW - GERACAO_INTERMITENTE_PREVISTA
    
    logging.info(f"Carga Total Prevista: {CARGA_PREVISTA_MW:.2f} MW")
    logging.info(f"Geração Intermitente Prevista: {GERACAO_INTERMITENTE_PREVISTA:.2f} MW")
    logging.info(f"Demanda Remanescente para Hidrelétrica: {DEMANDA_REMANESCENTE:.2f} MW")
    
    # --- Passo 2: Executar a Otimização ---
    
    # Chamar a função de otimização
    despacho_final = optimization_dispatch(CARGA_PREVISTA_MW, GERACAO_INTERMITENTE_PREVISTA)
    
    # --- Passo 3: MLOps Conceitual ---
    if despacho_final is not None:
        logging.info(f"\n[MLOps / INTEGRAÇÃO]: O valor de Despacho Otimizado ({despacho_final:.2f} MW) é enviado para o sistema operacional da usina em tempo real.")

2025-09-29 15:43:21,372 - INFO - Carga Total Prevista: 25700.21 MW
2025-09-29 15:43:21,373 - INFO - Geração Intermitente Prevista: 24500.00 MW
2025-09-29 15:43:21,374 - INFO - Demanda Remanescente para Hidrelétrica: 1200.21 MW
2025-09-29 15:43:21,374 - INFO - 
--- Iniciando Otimização da Curva Horária (PuLP) ---
2025-09-29 15:43:21,376 - INFO - Restrição Ativa: G_hidro deve ser entre 400.0 MW e 1500.0 MW.
2025-09-29 15:43:21,408 - INFO - O Despacho garante um erro de atendimento mínimo de: 0.00 MW
2025-09-29 15:43:21,408 - INFO - Restrição Mínima Obrigatória (400.0 MW) respeitada.
2025-09-29 15:43:21,409 - INFO - 
[MLOps / INTEGRAÇÃO]: O valor de Despacho Otimizado (1200.21 MW) é enviado para o sistema operacional da usina em tempo real.


In [12]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import LSTM, Dense
from pulp import LpProblem, LpMinimize, LpVariable, LpStatus, value
import logging
import os
import joblib # Usado para salvar e carregar o scaler (prática comum em MLOps)

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- CONFIGURAÇÕES DE PATHS E MODELO (PARA SERVIÇO) ---

# O caminho onde o modelo final será salvo
MODEL_DIR = "hpo_model_deploy"
os.makedirs(MODEL_DIR, exist_ok=True)

MODEL_FILENAME = os.path.join(MODEL_DIR, "lstm_hpo_model.h5")
SCALER_FILENAME = os.path.join(MODEL_DIR, "scaler_hpo.pkl")

# Parâmetros Operacionais (Importantes para a Otimização)
MIN_GERACAO_OBRIGATORIA = 400.0  # MW
MAX_GERACAO_CAPACIDADE = 1500.0  # MW

# Variáveis (Devem ser iguais às usadas no treinamento)
FEATURES = ['carga_mw_subsistema', 'frequencia_hz', 'geracao_eolica_mw',
            'restricao_vazao', 'CHUVA', 'TEMP_BULB_SECO', 'carga_lag_24h']
TARGET = 'carga_mw_subsistema' 
TIME_STEPS = 24  


# --- 1. FUNÇÕES ESSENCIAIS DE OTIMIZAÇÃO E PREVISÃO (CÓPIA) ---

def optimization_dispatch(carga_prevista_mw: float, geracao_intermitente_prevista: float) -> float:
    """Função de Otimização (PuLP) - Retorna o Despacho Ideal."""
    model = LpProblem("Otimizacao_Despacho_Hidreletrica", LpMinimize)
    
    G_hidro = LpVariable("G_hidro", lowBound=MIN_GERACAO_OBRIGATORIA, upBound=MAX_GERACAO_CAPACIDADE, cat='Continuous')
    delta_positivo = LpVariable("delta_pos", lowBound=0)
    delta_negativo = LpVariable("delta_neg", lowBound=0)
    
    model += delta_positivo + delta_negativo, "Minimizar_Erro_Despacho"
    geracao_total = G_hidro + geracao_intermitente_prevista
    model += (carga_prevista_mw - geracao_total) == (delta_positivo - delta_negativo), "Equilibrio_Carga"
    
    model.solve()
    
    if LpStatus[model.status] == "Optimal":
        return value(G_hidro)
    else:
        logging.error("Otimização falhou. Retornando mínimo obrigatório por segurança.")
        return MIN_GERACAO_OBRIGATORIA

def inverse_transform_target(scaled_value, scaler, features_list, target_name):
    """Desnormaliza o valor previsto para a escala MW real."""
    target_index = features_list.index(target_name)
    dummy_array = np.zeros((1, len(features_list)))
    dummy_array[:, target_index] = scaled_value.flatten()
    return scaler.inverse_transform(dummy_array)[:, target_index][0]


# --- 2. FUNÇÃO DE SERVIÇO (API DE INFERÊNCIA) ---

def predict_and_optimize_realtime(new_data_sequence: np.ndarray, model, scaler):
    """
    Simula a API que roda o modelo em tempo real e chama a otimização.
    
    Args:
        new_data_sequence: Últimas 24h de dados operacionais (já normalizados e formatados).
    """
    logging.info("\n[API] Recebendo sequência de 24h para inferência.")
    
    # A sequência de entrada deve ter o shape (1, 24, 7)
    if new_data_sequence.shape != (1, TIME_STEPS, len(FEATURES)):
        logging.error(f"Formato de entrada incorreto. Esperado (1, {TIME_STEPS}, {len(FEATURES)})")
        return None
    
    # 1. Previsão da Carga Futura (P)
    predicted_scaled = model.predict(new_data_sequence)[0] # Resultado em escala normalizada
    carga_prevista_mw = inverse_transform_target(predicted_scaled, scaler, FEATURES, TARGET)
    
    logging.info(f"PREVISÃO LSTM: Carga Futura estimada em {carga_prevista_mw:.2f} MW.")
    
    # 2. Extração da Geração Intermitente Prevista
    # No mundo real, a Geração Intermitente viria de outro modelo ou previsão de mercado.
    # Aqui, simulamos que a geração intermitente é a última da sequência de entrada (última hora da janela)
    # do seu conjunto de features.
    intermitente_scaled = new_data_sequence[0, -1, FEATURES.index('geracao_eolica_mw')]
    
    # Desnormalizamos APENAS a intermitente para ser usada na Otimização
    dummy_array = np.zeros((1, len(FEATURES)))
    dummy_array[:, FEATURES.index('geracao_eolica_mw')] = intermitente_scaled
    geracao_intermitente_prevista = scaler.inverse_transform(dummy_array)[:, FEATURES.index('geracao_eolica_mw')][0]
    
    
    # 3. Otimização do Despacho (O)
    despacho_otimizado = optimization_dispatch(carga_prevista_mw, geracao_intermitente_prevista)
    
    if despacho_otimizado is not None:
        logging.warning(f"[RESULTADO FINAL ENVIADO À USINA]: Despachar {despacho_otimizado:.2f} MW (Hidro) para a próxima hora.")
        return {"despacho_otimizado": despacho_otimizado}
    return None


# --- 3. EXECUÇÃO PRINCIPAL E DEPLOY ---

if __name__ == "__main__":
    # --- Passo 1: SERIALIZAR O MODELO E O SCALER ---
    
    # (Requer re-execução das etapas de load e train para obter os objetos)
    # NOTA: Assumimos que você já possui os objetos 'model' e 'SCALER_GLOBAL' do passo anterior.
    
    # SIMULAÇÃO DA SERIALIZAÇÃO (Se você tivesse o objeto 'model' e 'SCALER_GLOBAL')
    
    # CÓDIGO CONCEITUAL:
    # model.save(MODEL_FILENAME)
    # joblib.dump(SCALER_GLOBAL, SCALER_FILENAME)
    # logging.info(f"Modelo e Scaler salvos em {MODEL_DIR}")
    
    # Para prosseguir, usaremos objetos fictícios:
    
    # Simulação: Carregando o modelo (em MLOps real, o serviço faria isso)
    
    # Criamos um modelo fictício para a inferência:
    X_ficticio = np.random.rand(1, TIME_STEPS, len(FEATURES))
    
    # --- Fim da Simulação ---
    
    logging.info("\n--- SIMULAÇÃO DO DEPLOY E INFERÊNCIA EM TEMPO REAL ---")
    
    # Na prática MLOps, a API carregaria o modelo antes de receber a primeira requisição.
    try:
        # Tenta carregar o modelo e o scaler (Se você rodou o código de save)
        # model_loaded = load_model(MODEL_FILENAME)
        # scaler_loaded = joblib.load(SCALER_FILENAME)
        
        # Como não salvamos de fato, usamos a instância do modelo treinado anteriormente (model)
        # e o SCALER_GLOBAL (que assumimos estar carregado em uma execução prévia)
        
        # Chamada da API com novos dados (Simulamos 24h de dados recém-coletados)
        # 24h de dados padronizados (0 a 1)
        new_data_for_prediction = np.random.rand(1, TIME_STEPS, len(FEATURES)) 
        
        # Para demonstração, o scaler_loaded será uma instância MinMaxScaler vazia (simplificação)
        scaler_loaded = MinMaxScaler(feature_range=(0, 1))
        
        # NOTE: Aqui precisaria do modelo treinado. 
        # Como o script é modular, vamos simular o resultado da previsão para focar no fluxo MLOps.
        
        # SIMULAÇÃO DO RESULTADO DA PREVISÃO:
        SIMULATED_PREDICTION_MW = 25800.0  # Nova carga prevista
        SIMULATED_INTERMITENTE = 24600.0  # Nova intermitente prevista
        
        despacho = optimization_dispatch(SIMULATED_PREDICTION_MW, SIMULATED_INTERMITENTE)
        
        logging.warning(f"SUCESSO MLOPS: O Sistema de Despacho recebeu o valor {despacho:.2f} MW via API de Inferência.")

    except Exception as e:
        logging.error(f"Falha na simulação de carga da API (MLOps): {e}")

2025-09-29 15:43:21,474 - INFO - 
--- SIMULAÇÃO DO DEPLOY E INFERÊNCIA EM TEMPO REAL ---


## Plano de Ação Final: Visualização, Aprimoramento e Documentação MLOps (HPO)

### 1. Visualização Operacional (Monitoramento em Tempo Real)

A visualização é a interface que garante a confiança e a adoção do operador do ONS. O dashboard deve se concentrar em mostrar o valor da **Previsão** e da **Otimização**.

| Métrica Essencial | Dashboard (Visão Operacional) | Objetivo no Projeto HPO |
| :--- | :--- | :--- |
| **Geração Otimizada vs. Realizada** | **Curva Horária de Despacho (Gráfico de Linha):** Mostrar a **Sugestão Otimizada (PuLP)** *vs.* o valor que a usina **Realmente Despachou**. | Monitorar a adesão à Curva Otimizada e identificar falhas de integração ou operacionais. |
| **Desvio de Carga ($\Delta$ Carga)** | **KPI de RMSE Recente:** Exibir o **RMSE** calculado nas últimas 24h. | Medir a confiança do modelo. Se o RMSE aumentar drasticamente, aciona um alerta para re-treino. |
| **Estabilidade do Sistema** | **Indicador de Frequência e Tensão (Semaforização):** Mostrar `frequencia_hz` em tempo real e sinalizar em vermelho/amarelo quando o modelo estiver operando próximo aos limites críticos. | Mitigar os impactos das variações na frequência e tensão. |
| **Restrições Ambientais** | **KPI:** Geração Mínima Obrigatória. | Mostrar se o valor de **Despacho Otimizado** está violando a **Restrição Mínima Obrigatória** (a validação do PuLP). |

### 2. Aprimoramento do Modelo (Hyperparameter Tuning - Conceitual)

O objetivo é passar de um RMSE de $16.82 \text{ MW}$ para um nível ainda mais baixo, usando a técnica de *Hyperparameter Tuning*.

**Plano de Refinamento (Simulação com Keras Tuner/Optuna):**

1.  **Objetivo:** Reduzir o **RMSE** no conjunto de teste.
2.  **Parâmetros a Otimizar (Tuning):**
    * **`TIME_STEPS` (Janela de Tempo):** Otimizar se 24h ou 48h de dados fornecem um contexto melhor para prever a próxima hora.
    * **`LSTM Units` (Tamanho da Camada):** Otimizar o número de neurônios (e.g., de 50 para 64, 100, etc.) para encontrar o equilíbrio entre a complexidade e o risco de *overfitting*.
    * **`Learning Rate` (Taxa de Aprendizado):** Otimizar a velocidade com que o modelo ajusta seus pesos durante o treinamento.
3.  **Processo:** Executar o *Tuning* (por exemplo, com validação cruzada *Time-Series*) para identificar a **melhor combinação de hiperparâmetros** que resulte no menor RMSE no conjunto de dados não vistos.

### 3. Documentação MLOps e Pipeline CI/CD

Esta documentação garante a sustentabilidade e a confiabilidade do **Sistema Preditivo Integrado** ao longo do tempo.

| Componente MLOps | Descrição e Ação (Baseado em seus Habilidades) |
| :--- | :--- |
| **Gatilho de Retreinamento (CI/CD)** | O modelo deve ser retreinado automaticamente quando: 1) Uma **nova semana** de dados do SIN estiver disponível. 2) O **RMSE no monitoramento ao vivo** exceder um limite crítico (e.g., $50 \text{ MW}$). |
| **Pipeline de Teste Automatizado** | Antes do *Deploy*: Executar testes de **Sanidade de Dados** (verificar se `geracao_eolica_mw` é não-negativo) e testes de **Performance do Modelo** (confirmar que o novo RMSE é $\le 18 \text{ MW}$). |
| **Deploy (TensorFlow Serving)** | O modelo LSTM treinado é serializado (`model.save()`) e servido em um container Docker, garantindo que o sistema de operação possa acessá-lo via **endpoint HTTP** para inferência em tempo real. |
| **Rollback** | Em caso de falha de comunicação ou aumento repentino e inesperado do erro de previsão (monitoramento), o sistema deve automaticamente reverter para a versão anterior (estável) do modelo. |