## Introdu√ß√£o √† Metodologia de Previs√£o de Pre√ßo com LSTM e Indicadores T√©cnicos

Este c√≥digo implementa uma metodologia moderna para previs√£o de pre√ßos de a√ß√µes no curt√≠ssimo prazo (intradia), utilizando redes neurais recorrentes (LSTM bidirecionais) em conjunto com uma ampla gama de indicadores t√©cnicos cl√°ssicos. A abordagem combina princ√≠pios tradicionais da an√°lise t√©cnica com t√©cnicas contempor√¢neas de aprendizado profundo.

> **Importante**: Esta implementa√ß√£o est√° sendo aplicada inicialmente √† a√ß√£o `VALE3.SA`, da mineradora Vale, como uma **prova de conceito (PoC)**. A escolha se deve √† sua alta liquidez e relev√¢ncia no mercado brasileiro. A inten√ß√£o √©, ap√≥s valida√ß√£o da abordagem com esta a√ß√£o, **escalar a metodologia para outras a√ß√µes da bolsa** que apresentem perfil semelhante ou apresentem interesse estrat√©gico.

A seguir, descrevemos os principais componentes da metodologia:

### 1. **Aquisi√ß√£o de Dados**
Utiliza-se a biblioteca `yfinance` para coletar dados intradi√°rios (com granularidade de 1 minuto) da a√ß√£o `VALE3.SA` por um per√≠odo de 7 dias. Os dados incluem colunas como `Open`, `High`, `Low`, `Close` e `Volume`.

### 2. **Engenharia de Atributos T√©cnicos**
A fun√ß√£o `add_technical_indicators` incorpora uma rica variedade de indicadores t√©cnicos ao conjunto de dados, dentre os quais se destacam:

- **Indicadores de momentum**: RSI, Estoc√°stico, Oscilador Awesome.
- **Indicadores de tend√™ncia**: MACD, ADX, CCI, M√©dia M√≥vel Exponencial.
- **Indicadores de volatilidade**: Bandas de Bollinger, ATR.
- **Indicadores de volume**: OBV, VWAP, √çndice de Acumula√ß√£o/Distribui√ß√£o.
- **Caracter√≠sticas de candlestick**: corpo, sombras e amplitude do candle.

Esses atributos auxiliam o modelo a captar padr√µes n√£o triviais no comportamento dos pre√ßos.

### 3. **Normaliza√ß√£o e Sequenciamento**
Os dados s√£o normalizados com `MinMaxScaler` e, em seguida, organizados em sequ√™ncias temporais (janelas deslizantes) com tamanho vari√°vel (ex. 24, 36, 60 minutos), de modo a alimentar a rede neural com informa√ß√µes hist√≥ricas para prever o pr√≥ximo valor de fechamento.

### 4. **Estrutura do Modelo**
O modelo preditivo √© uma rede neural do tipo **Bidirectional LSTM**, composta por duas camadas LSTM (com possibilidade de dropout), seguida de uma camada densa para sa√≠da √∫nica (pre√ßo futuro). A bidirecionalidade permite √† rede capturar rela√ß√µes tanto no sentido passado ‚Üí futuro quanto futuro ‚Üí passado.

### 5. **Treinamento e Avalia√ß√£o**
O modelo √© treinado com valida√ß√£o cruzada (via `validation_split`) e parada antecipada (`EarlyStopping`). Para cada combina√ß√£o de hiperpar√¢metros, calcula-se o erro m√©dio absoluto (MAE) e o erro quadr√°tico m√©dio da raiz (RMSE) com base em dados de teste.

### 6. **Otimiza√ß√£o de Hiperpar√¢metros**
A busca por melhores combina√ß√µes de hiperpar√¢metros √© feita atrav√©s de uma busca randomizada, onde m√∫ltiplas configura√ß√µes s√£o testadas automaticamente, e os resultados s√£o registrados para identifica√ß√£o do melhor desempenho.

### 7. **Visualiza√ß√£o dos Resultados**
Ap√≥s o melhor modelo ser identificado, suas previs√µes s√£o desnormalizadas e comparadas graficamente com os valores reais. O gr√°fico resultante mostra visualmente a capacidade preditiva do modelo.

---

Essa metodologia visa conciliar o conhecimento consagrado dos mercados financeiros (an√°lise t√©cnica) com as potencialidades do aprendizado de m√°quina sequencial, oferecendo uma base robusta para previs√µes em cen√°rios de alta frequ√™ncia e curto prazo.

O uso inicial da a√ß√£o VALE3 permite validar a robustez da abordagem com um ativo de grande liquidez. Uma vez confirmada a efic√°cia, a arquitetura ser√° reaproveitada e ajustada para outras a√ß√µes brasileiras, com foco na escalabilidade e reprodutibilidade do pipeline.


In [None]:
import numpy as np
import pandas as pd
import yfinance as yf
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_absolute_error, mean_squared_error
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout, Bidirectional
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import EarlyStopping
from ta.momentum import RSIIndicator
from ta.trend import MACD, EMAIndicator
from ta.volatility import BollingerBands
from ta.volume import VolumeWeightedAveragePrice
from ta.momentum import StochasticOscillator, AwesomeOscillatorIndicator
from ta.volume import VolumeWeightedAveragePrice, OnBalanceVolumeIndicator, AccDistIndexIndicator
from ta.trend import CCIIndicator, ADXIndicator, EMAIndicator
from ta.volatility import AverageTrueRange
import random

# --- Par√¢metros fixos ---

symbol = 'VALE3.SA'
period = '7d'
interval = '1m'
SEQ_LENGTH_DEFAULT = 24
TEST_SIZE = 0.2
VALIDATION_SPLIT = 0.2

A fun√ß√£o `add_technical_indicators` √© respons√°vel por enriquecer um `DataFrame` de pre√ßos de a√ß√µes com uma ampla variedade de **indicadores t√©cnicos cl√°ssicos**, comumente utilizados em an√°lise t√©cnica para tomada de decis√£o no mercado financeiro.

Essa fun√ß√£o assume que o `DataFrame` de entrada (`df`) cont√©m, pelo menos, as colunas: `Open`, `High`, `Low`, `Close`, e `Volume`.

### Vis√£o Geral

- **Objetivo:** Adicionar colunas com indicadores t√©cnicos calculados a partir dos pre√ßos hist√≥ricos da a√ß√£o.
- **Pr√©-condi√ß√£o:** A coluna `'Close'` deve existir no `DataFrame`. Caso contr√°rio, uma exce√ß√£o ser√° lan√ßada.
- **Tratamento de Erros:** Qualquer falha no c√°lculo dos indicadores resulta em uma exce√ß√£o com mensagem detalhada.

---

### Indicadores Adicionados

Abaixo, listam-se os indicadores inclu√≠dos e seu prop√≥sito:

#### 1. **Indicadores de Momentum**

- `RSI`: √çndice de For√ßa Relativa com janela de 14 per√≠odos.
- `Stoch_K` e `Stoch_D`: Oscilador Estoc√°stico %K e sua m√©dia m√≥vel %D.
- `Awesome_Oscillator`: Mede a for√ßa do momentum com duas m√©dias m√≥veis simples (5 e 34).

#### 2. **Indicadores de Tend√™ncia**

- `MACD`, `MACD_signal`, `MACD_diff`: Conjunto completo de MACD (12, 26, 9), incluindo linha de sinal e histograma.
- `CCI`: Commodity Channel Index com janela de 20 per√≠odos.
- `ADX`, `ADX_pos`, `ADX_neg`: √çndice Direcional M√©dio (ADX), e componentes positivo e negativo, com janela de 14 per√≠odos.
- `EMA_20`: M√©dia m√≥vel exponencial de 20 per√≠odos.

#### 3. **Indicadores de Volatilidade**

- `BB_upper`, `BB_middle`, `BB_lower`: Bandas de Bollinger (20 per√≠odos, 2 desvios padr√£o).
- `ATR`: True Range M√©dio (Average True Range) com janela de 14 per√≠odos.

#### 4. **Indicadores de Volume**

- `OBV`: On-Balance Volume.
- `AccDistIndex`: √çndice de Acumula√ß√£o/Distribui√ß√£o.
- `VWAP`: Pre√ßo m√©dio ponderado por volume, com janela de 14 per√≠odos (calculado somente se todas as colunas requeridas estiverem presentes).

#### 5. **Caracter√≠sticas do Candle**

- `Candle_Body`: Corpo do candle (Close - Open).
- `Candle_Range`: Amplitude do candle (High - Low).
- `Upper_Shadow`: Sombra superior (High - max(Open, Close)).
- `Lower_Shadow`: Sombra inferior (min(Open, Close) - Low).

---

### Import√¢ncia

A fun√ß√£o √© parte fundamental da **engenharia de atributos (feature engineering)** do pipeline de aprendizado de m√°quina, permitindo que o modelo LSTM receba n√£o apenas a s√©rie temporal bruta de pre√ßos, mas tamb√©m vari√°veis derivadas que capturam comportamento de tend√™ncia, momentum, revers√µes e press√µes de compra/venda.

Estes indicadores enriquecem os dados com uma **representa√ß√£o multidimensional do contexto do pre√ßo**, melhorando a capacidade preditiva do modelo.



In [None]:
# --- Fun√ß√£o para adicionar indicadores t√©cnicos ---
def add_technical_indicators(df):
    if 'Close' not in df.columns:
        raise ValueError("DataFrame n√£o cont√©m coluna 'Close'")

    try:
        df['RSI'] = RSIIndicator(close=df['Close'], window=14).rsi()

        stoch = StochasticOscillator(high=df['High'], low=df['Low'], close=df['Close'], window=14, smooth_window=3)
        df['Stoch_K'] = stoch.stoch()
        df['Stoch_D'] = stoch.stoch_signal()

        ao = AwesomeOscillatorIndicator(high=df['High'], low=df['Low'], window1=5, window2=34)
        df['Awesome_Oscillator'] = ao.awesome_oscillator()

        macd = MACD(close=df['Close'], window_slow=26, window_fast=12, window_sign=9)
        df['MACD'] = macd.macd()
        df['MACD_signal'] = macd.macd_signal()
        df['MACD_diff'] = macd.macd_diff()


        df['CCI'] = CCIIndicator(high=df['High'], low=df['Low'], close=df['Close'], window=20).cci()

        adx = ADXIndicator(high=df['High'], low=df['Low'], close=df['Close'], window=14)
        df['ADX'] = adx.adx()
        df['ADX_pos'] = adx.adx_pos()
        df['ADX_neg'] = adx.adx_neg()

        df['EMA_20'] = EMAIndicator(close=df['Close'], window=20).ema_indicator()

        bb = BollingerBands(close=df['Close'], window=20, window_dev=2)
        df['BB_upper'] = bb.bollinger_hband()
        df['BB_middle'] = bb.bollinger_mavg()
        df['BB_lower'] = bb.bollinger_lband()


        df['ATR'] = AverageTrueRange(high=df['High'], low=df['Low'], close=df['Close'], window=14).average_true_range()

        df['OBV'] = OnBalanceVolumeIndicator(close=df['Close'], volume=df['Volume']).on_balance_volume()
        df['AccDistIndex'] = AccDistIndexIndicator(high=df['High'], low=df['Low'], close=df['Close'], volume=df['Volume']).acc_dist_index()

        if all(col in df.columns for col in ['High', 'Low', 'Close', 'Volume']):
            df['VWAP'] = VolumeWeightedAveragePrice(
                high=df['High'],
                low=df['Low'],
                close=df['Close'],
                volume=df['Volume'],
                window=14
            ).volume_weighted_average_price()
        else:
            df['VWAP'] = np.nan

        df['Candle_Body'] = df['Close'] - df['Open']
        df['Candle_Range'] = df['High'] - df['Low']
        df['Upper_Shadow'] = df['High'] - df[['Close', 'Open']].max(axis=1)
        df['Lower_Shadow'] = df[['Close', 'Open']].min(axis=1) - df['Low']

    except Exception as e:
        print(f"Erro ao calcular indicadores t√©cnicos: {str(e)}")
        raise

    return df

Neste m√≥dulo, s√£o definidas duas fun√ß√µes essenciais para a constru√ß√£o e avalia√ß√£o de um modelo de aprendizado profundo do tipo LSTM Bidirecional, aplicado √† previs√£o de s√©ries temporais financeiras.

---

### üìå Fun√ß√£o: `create_sequences(data, seq_length)`

Essa fun√ß√£o transforma os dados de entrada em **sequ√™ncias temporais**, conforme necess√°rio para o treinamento de modelos do tipo LSTM.

#### **Par√¢metros:**
- `data`: Matriz NumPy com os dados normalizados, geralmente incluindo v√°rios indicadores t√©cnicos.
- `seq_length`: Quantidade de passos temporais considerados em cada sequ√™ncia (janela deslizante).

#### **Retorno:**
- `X`: Conjunto de entradas com forma `(n_amostras, seq_length, n_features)`.
- `y`: Vetor de sa√≠das com o valor da vari√°vel alvo (geralmente o pre√ßo de fechamento) no instante seguinte √† sequ√™ncia.

#### **L√≥gica:**
Para cada posi√ß√£o `i` no tempo:
- `X[i]` = subconjunto de `data` com `seq_length` linhas (passos temporais).
- `y[i]` = valor da vari√°vel alvo na posi√ß√£o `i + seq_length`.

Esse formato √© ideal para treinar modelos que aprendem padr√µes temporais.

---

### üìå Fun√ß√£o: `train_and_evaluate(...)`

Essa fun√ß√£o encapsula todo o processo de constru√ß√£o, treinamento, valida√ß√£o e avalia√ß√£o do modelo preditivo.

#### **Par√¢metros:**
- `X_train`, `y_train`: Dados de treino.
- `X_test`, `y_test`: Dados de teste.
- `params`: Dicion√°rio de hiperpar√¢metros, incluindo:
  - `'lstm_units_1'`, `'lstm_units_2'`: N√∫mero de unidades LSTM em cada camada.
  - `'dropout'`: Taxa de dropout.
  - `'learning_rate'`: Taxa de aprendizado.
  - `'epochs'`: N√∫mero m√°ximo de √©pocas.
  - `'batch_size'`: Tamanho do lote.
  - `'seq_length'`: Tamanho das sequ√™ncias de entrada.
  - `'scaler'`: Objeto scaler usado para normaliza√ß√£o.
- `n_features`: N√∫mero de colunas (indicadores) por amostra.

---

### üîß Arquitetura do Modelo

A fun√ß√£o monta uma **rede neural recorrente** com a seguinte estrutura:

```text
Entrada (shape: seq_length x n_features)
‚Üì
Camada LSTM bidirecional (1¬™)
‚Üì
Dropout
‚Üì
Camada LSTM bidirecional (2¬™)
‚Üì
Dropout
‚Üì
Camada Densa (1 unidade - sa√≠da cont√≠nua)
```

- **LSTM Bidirecional**: Permite que o modelo aprenda depend√™ncias temporais tanto do passado quanto do futuro da sequ√™ncia.
- **Dropout**: Previne overfitting ao remover conex√µes aleatoriamente durante o treinamento.

---

### üß™ Valida√ß√£o e Early Stopping

- **Valida√ß√£o**: 10% (ou valor definido em `VALIDATION_SPLIT`) do conjunto de treino √© usado para valida√ß√£o durante o treinamento.
- **EarlyStopping**: Interrompe o treinamento se a perda de valida√ß√£o n√£o melhorar ap√≥s 10 √©pocas consecutivas, evitando overfitting.

---

### üîÑ Invers√£o da Escala

Como os dados s√£o normalizados antes do treino, a fun√ß√£o realiza a **invers√£o da normaliza√ß√£o** para interpretar os resultados em escala original:

```python
def inverse_transform(scaler, data):
    dummy = np.zeros((len(data), n_features))
    dummy[:, 0] = data.flatten()
    return scaler.inverse_transform(dummy)[:, 0]
```

A invers√£o √© feita apenas para a **primeira coluna**, que representa o valor de `Close`.

---

### üìä Avalia√ß√£o Final

A fun√ß√£o retorna:

- `rmse`: Erro quadr√°tico m√©dio da previs√£o (em escala original).
- `mae`: Erro absoluto m√©dio da previs√£o.
- `history`: Hist√≥rico do treinamento (valores de perda por √©poca).
- `model`: Modelo treinado (objeto Keras).

---

### üí° Observa√ß√£o

Essas fun√ß√µes foram projetadas para integrar um pipeline de aprendizado profundo aplicado inicialmente aos dados da **a√ß√£o da VALE (VALE3.SA)**, como uma **prova de conceito (PoC)**. Ap√≥s valida√ß√£o do desempenho, o mesmo modelo poder√° ser generalizado para outras a√ß√µes ou ativos financeiros, com base na robustez dos indicadores t√©cnicos e da modelagem sequencial temporal.

---


In [None]:
# --- Fun√ß√£o para criar sequ√™ncias ---
def create_sequences(data, seq_length):
    X, y = [], []
    for i in range(len(data) - seq_length - 1):
        X.append(data[i:(i + seq_length), :])
        y.append(data[i + seq_length, 0])  # Close price na posi√ß√£o 0
    return np.array(X), np.array(y)

# --- Fun√ß√£o para treinar e avaliar o modelo ---
def train_and_evaluate(X_train, y_train, X_test, y_test, params, n_features):  
    model = Sequential([
        Bidirectional(LSTM(params['lstm_units_1'], return_sequences=True), input_shape=(params['seq_length'], n_features)),
        Dropout(params['dropout']),
        Bidirectional(LSTM(params['lstm_units_2'])),
        Dropout(params['dropout']),
        Dense(1)
    ])
    
    optimizer = Adam(learning_rate=params['learning_rate'])
    model.compile(optimizer=optimizer, loss='mse')
    
    early_stop = EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)
    
    history = model.fit(
        X_train, y_train,
        epochs=params['epochs'],
        batch_size=params['batch_size'],
        validation_split=VALIDATION_SPLIT,
        verbose=0,
        callbacks=[early_stop]
    )
    
    train_pred = model.predict(X_train)
    test_pred = model.predict(X_test)
    
    # Fun√ß√£o para inverter escala
    def inverse_transform(scaler, data):
        dummy = np.zeros((len(data), n_features))
        dummy[:, 0] = data.flatten()
        return scaler.inverse_transform(dummy)[:, 0]
    
    y_test_inv = inverse_transform(params['scaler'], y_test)
    test_pred_inv = inverse_transform(params['scaler'], test_pred)
    
    rmse = np.sqrt(mean_squared_error(y_test_inv, test_pred_inv))
    mae = mean_absolute_error(y_test_inv, test_pred_inv)
    
    return rmse, mae, history, model


Este trecho de c√≥digo √© respons√°vel por coletar os dados hist√≥ricos da a√ß√£o, enriquecer com indicadores t√©cnicos e preparar os dados em formato adequado para o treinamento de um modelo de aprendizado profundo.

---

### üì• Coleta de Dados com o `yfinance`

```python
df = yf.download(symbol, period=period, interval=interval, progress=True)
df.columns = df.columns.droplevel(1)
```

- Utiliza a biblioteca `yfinance` para baixar dados hist√≥ricos de pre√ßos do ativo definido pela vari√°vel `symbol`.
- `period` define o intervalo temporal (ex: `"2y"`).
- `interval` define a granularidade (ex: `"1d"`, `"1h"`).
- Algumas vezes os dados retornam com MultiIndex; `droplevel(1)` limpa isso.

---

### üìà Enriquecimento com Indicadores T√©cnicos

```python
df = add_technical_indicators(df)
df.dropna(inplace=True)
```

- A fun√ß√£o `add_technical_indicators(df)` insere colunas com indicadores de momentum, tend√™ncia, volatilidade, volume e padr√µes de candle.
- Ap√≥s o c√°lculo dos indicadores, valores iniciais podem conter `NaN` devido √†s janelas m√≥veis ‚Üí s√£o removidos com `dropna`.

---

### üß† Sele√ß√£o das Features

```python
available_features = [ ... ]
features = [f for f in available_features if f in df.columns]
df = df[features]
```

- Define um conjunto completo de **vari√°veis de entrada candidatas** (features) para o modelo.
- Utiliza uma verifica√ß√£o para garantir que apenas as colunas calculadas de fato (que existem em `df`) sejam usadas.
- Garante consist√™ncia e evita erros caso alguma feature falhe durante o c√°lculo.

#### As features selecionadas incluem:
- **Pre√ßos e volume b√°sicos**: `Open`, `High`, `Low`, `Close`, `Volume`.
- **Indicadores t√©cnicos de momentum**: `RSI`, `Stoch_K`, `Stoch_D`, `Awesome_Oscillator`.
- **MACD e seus componentes**: `MACD`, `MACD_signal`, `MACD_diff`.
- **Indicadores de tend√™ncia**: `CCI`, `ADX`, `ADX_pos`, `ADX_neg`.
- **Bandas de Bollinger**: `BB_upper`, `BB_middle`, `BB_lower`.
- **M√©dia m√≥vel**: `EMA_20`.
- **Volatilidade**: `ATR`.
- **Volume inteligente**: `VWAP`, `OBV`, `AccDistIndex`.
- **Padr√µes de candle**: `Candle_Body`, `Candle_Range`, `Upper_Shadow`, `Lower_Shadow`.

---

### ‚úÇÔ∏è Divis√£o Treino/Teste com Normaliza√ß√£o

```python
def prepare_data(df, seq_length=SEQ_LENGTH_DEFAULT):
    num_samples = len(df) - seq_length - 1
    train_size = int(num_samples * (1 - TEST_SIZE))
    
    df_train = df.iloc[:train_size + seq_length + 1].copy()
    df_test = df.iloc[train_size:].copy()
```

- Define a propor√ß√£o de treino/teste com base na constante `TEST_SIZE` (ex: 0.2).
- Garante que tanto o conjunto de treino quanto o de teste contenham sequ√™ncias completas (`+ seq_length + 1`).

---

### üìä Normaliza√ß√£o com `MinMaxScaler`

```python
scaler = MinMaxScaler()
scaler.fit(df_train)
train_scaled = scaler.transform(df_train)
test_scaled = scaler.transform(df_test)
```

- Aplica a **normaliza√ß√£o MinMax** nos dados, transformando os valores para a faixa `[0, 1]`.
- **Importante**: o scaler √© treinado **apenas com dados de treino**, para evitar vazamento de informa√ß√£o (`data leakage`).

---

### üîÑ Cria√ß√£o das Sequ√™ncias Temporais

```python
X_train, y_train = create_sequences(train_scaled, seq_length)
X_test, y_test = create_sequences(test_scaled, seq_length)
```

- Gera os conjuntos de entrada (`X`) e sa√≠da (`y`) para o modelo, com base nas janelas de `seq_length` per√≠odos.

---

### üîö Retorno da Fun√ß√£o

```python
return X_train, y_train, X_test, y_test, scaler
```

- A fun√ß√£o retorna os dados processados e prontos para o treinamento, al√©m do `scaler`, que ser√° necess√°rio para inverter a normaliza√ß√£o ap√≥s a predi√ß√£o.

---

### üß™ Contexto da Prova de Conceito (PoC)

Este pipeline de prepara√ß√£o de dados foi desenvolvido no contexto de uma **prova de conceito (PoC)** uti


In [None]:
df = yf.download(symbol, period=period, interval=interval, progress=True)
df.columns = df.columns.droplevel(1)

df = add_technical_indicators(df)
df.dropna(inplace=True)

available_features = [
    'Open', 'High', 'Low', 'Close', 'Volume',             # Pre√ßos e volume b√°sicos
    'RSI', 'Stoch_K', 'Stoch_D', 'Awesome_Oscillator',    # Indicadores de momentum
    'MACD', 'MACD_signal', 'MACD_diff',                   # MACD
    'CCI', 'ADX', 'ADX_pos', 'ADX_neg',                   # Indicadores de tend√™ncia
    'BB_upper', 'BB_middle', 'BB_lower',                  # Bandas de Bollinger
    'EMA_20',                                             # M√©dia m√≥vel exponencial
    'ATR',                                                # Volatilidade
    'VWAP', 'OBV', 'AccDistIndex',                        # Indicadores de volume
    'Candle_Body', 'Candle_Range', 'Upper_Shadow', 'Lower_Shadow'  # Candlestick features
]

features = [f for f in available_features if f in df.columns]
print("Features selecionadas:", features)

df = df[features]

# --- Divis√£o treino/teste ---
def prepare_data(df, seq_length=SEQ_LENGTH_DEFAULT):
    num_samples = len(df) - seq_length - 1
    train_size = int(num_samples * (1 - TEST_SIZE))
    df_train = df.iloc[:train_size + seq_length + 1].copy()
    df_test = df.iloc[train_size:].copy()
    
    scaler = MinMaxScaler()
    scaler.fit(df_train)
    train_scaled = scaler.transform(df_train)
    test_scaled = scaler.transform(df_test)
    
    X_train, y_train = create_sequences(train_scaled, seq_length)
    X_test, y_test = create_sequences(test_scaled, seq_length)
    return X_train, y_train, X_test, y_test, scaler

## üîß Busca Randomizada de Hiperpar√¢metros para Modelos LSTM

Este bloco de c√≥digo realiza uma **busca aleat√≥ria (random search)** para encontrar a melhor combina√ß√£o de hiperpar√¢metros de um modelo LSTM bidirecional, visando minimizar o erro RMSE (Root Mean Squared Error) na previs√£o de pre√ßos de ativos financeiros.

---

### üéØ Objetivo da Otimiza√ß√£o

Selecionar, entre diferentes combina√ß√µes de hiperpar√¢metros, aquela que oferece o melhor desempenho em termos de RMSE sobre o conjunto de teste. O processo explora o espa√ßo de configura√ß√µes e compara os resultados, armazenando o melhor modelo encontrado.

---

### üß∞ Defini√ß√£o do Espa√ßo de Busca

```python
search_space = {
    'seq_length': [12, 24, 36, 48, 60],
    'batch_size': [16, 32, 64, 128],
    'epochs': [50, 80, 100, 120, 150],
    'lstm_units_1': [64, 128, 256, 384, 512],
    'lstm_units_2': [32, 64, 128, 192, 256],
    'dropout': [0.1, 0.2, 0.3, 0.4, 0.5],
    'learning_rate': [0.01, 0.005, 0.001, 0.0005, 0.0001, 0.00005]  
}
```

- Define os valores poss√≠veis para cada hiperpar√¢metro.
- **`seq_length`**: N√∫mero de observa√ß√µes anteriores usadas como entrada.
- **`batch_size`**: Quantidade de amostras processadas por itera√ß√£o.
- **`epochs`**: N√∫mero m√°ximo de ciclos de treinamento.
- **`lstm_units_1`/`lstm_units_2`**: N√∫mero de neur√¥nios nas camadas LSTM bidirecionais.
- **`dropout`**: Fra√ß√£o de unidades descartadas durante o treinamento para evitar overfitting.
- **`learning_rate`**: Taxa de aprendizado usada pelo otimizador `Adam`.

---

### üîÅ Processo de Busca Aleat√≥ria

```python
n_trials = 10
best_rmse = float('inf')
```

- Define `n_trials` como o n√∫mero total de execu√ß√µes (combina√ß√µes aleat√≥rias a serem testadas).
- Inicializa a vari√°vel `best_rmse` como infinito, para garantir que qualquer RMSE v√°lido ser√° menor.

---

### üì¶ Loop de Execu√ß√µes

```python
for trial in range(n_trials):
    params = {
        'seq_length': random.choice(...),
        ...
    }
```

- Para cada tentativa:
  - Seleciona **aleatoriamente** um valor para cada hiperpar√¢metro a partir do `search_space`.
  - Armazena os valores selecionados no dicion√°rio `params`.

---

### üìä Prepara√ß√£o de Dados com `prepare_data`

```python
X_train, y_train, X_test, y_test, scaler = prepare_data(df, seq_length=params['seq_length'])
params['scaler'] = scaler
```

- Os dados s√£o normalizados e divididos com base no `seq_length` escolhido.
- O `scaler` √© salvo dentro de `params` para permitir a invers√£o da escala posteriormente.

---

### üèãÔ∏è‚Äç‚ôÇÔ∏è Treinamento e Avalia√ß√£o

```python
rmse, mae, history, model = train_and_evaluate(...)
```

- Treina o modelo LSTM com os hiperpar√¢metros atuais.
- Avalia seu desempenho utilizando m√©tricas padronizadas:
  - **RMSE (Root Mean Squared Error)**: penaliza erros maiores.
  - **MAE (Mean Absolute Error)**: m√©dia dos erros absolutos.

---

### ‚úÖ Atualiza√ß√£o do Melhor Modelo

```python
if rmse < best_rmse:
    best_rmse = rmse
    best_params = params
    best_model = model
    best_history = history
```

- Se o modelo atual tiver desempenho superior ao melhor at√© ent√£o:
  - Salva os hiperpar√¢metros, o modelo treinado e o hist√≥rico de treinamento.

---

### üßæ Registro dos Resultados

```python
results.append({
    'trial': trial + 1,
    'rmse': rmse,
    'mae': mae,
    **params
})
```

- Armazena todas as m√©tricas e os hiperpar√¢metros testados para posterior an√°lise.

---

### üèÅ Resultados Finais

```python
print("\nMelhor RMSE:", best_rmse)
print("Melhores hiperpar√¢metros:", best_params)
```

- Exibe a melhor configura√ß√£o encontrada ap√≥s todos os testes realizados.

---

### üß† Considera√ß√µes T√©cnicas

- **Random Search** √© menos eficiente que m√©todos baseados em gradiente ou Bayesian Optimization, mas √∫til em contextos onde:
  - O custo de cada avalia√ß√£o √© alto.
  - O espa√ßo de busca √© n√£o cont√≠nuo.
  - A fun√ß√£o objetivo (modelo) √© n√£o diferenci√°vel.

- A randomiza√ß√£o evita vi√©s e permite cobrir melhor o espa√ßo de busca do que uma simples busca em grade (grid search) quando o n√∫mero de tentativas √© limitado.

- Este m√©todo √© especialmente adequado para provas de conceito (PoC) e cen√°rios com restri√ß√µes de tempo computacional.

---

### üìå Relev√¢ncia para S√©ries Temporais

Em modelos baseados em LSTM para s√©ries temporais:
- Pequenas varia√ß√µes em `seq_length`, `lstm_units` ou `learning_rate` podem ter impacto significativo na capacidade do modelo de **capturar padr√µes de longo prazo**.
- O uso de `Dropout` ajuda a combater o overfitting, comum quando h√° correla√ß√£o temporal elevada entre amostras adjacentes.

---

### üî¨ Pr√≥ximos Passos

- Persistir os melhores resultados (par√¢metros, m√©tricas, modelo).
- Visualizar o `history` de treinamento (loss x epochs).
- Avaliar generaliza√ß√£o para novos dados (valida√ß√£o out-of-sample).
- Implementar uma busca **Bayesiana** com `Optuna` ou `KerasTuner` para refinamento posterior.

---


In [None]:
# --- Espa√ßo de hiperpar√¢metros para busca ---
search_space = {
    'seq_length': [12, 24, 36, 48, 60],
    'batch_size': [16, 32, 64, 128],
    'epochs': [50, 80, 100, 120, 150],
    'lstm_units_1': [64, 128, 256, 384, 512],
    'lstm_units_2': [32, 64, 128, 192, 256],
    'dropout': [0.1, 0.2, 0.3, 0.4, 0.5],
    'learning_rate': [0.01, 0.005, 0.001, 0.0005, 0.0001, 0.00005]  
}

# --- Busca randomizada ---
n_trials = 10  # quantas combina√ß√µes testar
best_rmse = float('inf')
best_params = None
best_model = None
best_history = None
results = []

for trial in range(n_trials):
    params = {
        'seq_length': random.choice(search_space['seq_length']),
        'batch_size': random.choice(search_space['batch_size']),
        'epochs': random.choice(search_space['epochs']),
        'lstm_units_1': random.choice(search_space['lstm_units_1']),
        'lstm_units_2': random.choice(search_space['lstm_units_2']),
        'dropout': random.choice(search_space['dropout']),
        'learning_rate': random.choice(search_space['learning_rate']),
    }
    
    print(f"\nTrial {trial+1}/{n_trials} com params: {params}")
    
    # Preparar dados para o seq_length atual
    X_train, y_train, X_test, y_test, scaler = prepare_data(df, seq_length=params['seq_length'])
    params['scaler'] = scaler
    
    # Treinar e avaliar
    try:
        rmse, mae, history, model = train_and_evaluate(X_train, y_train, X_test, y_test, params, n_features=len(features))
        print(f"RMSE: {rmse:.4f} - MAE: {mae:.4f}")
        
        if rmse < best_rmse:
            best_rmse = rmse
            best_params = params
            best_model = model
            best_history = history
    except Exception as e:
        print(f"Erro no treino/avalia√ß√£o: {e}")
        
results.append({
    'trial': trial + 1,
    'rmse': rmse,
    'mae': mae,
    **params  # isso inclui todos os hiperpar√¢metros testados
})

print("\nMelhor RMSE:", best_rmse)
print("Melhores hiperpar√¢metros:", best_params)

| O c√≥digo plota um gr√°fico que compara os pre√ßos reais de fechamento com as previs√µes feitas pelo melhor modelo treinado. Para isso, ele primeiro reverte a escala dos dados normalizados para valores reais, tanto para os dados de teste quanto para as previs√µes, utilizando o mesmo scaler. Em seguida, exibe essa compara√ß√£o visualmente, permitindo avaliar a precis√£o do modelo na previs√£o dos pre√ßos ao longo do tempo.

In [None]:
# --- Plotar resultado com melhor modelo ---
if best_model:
    X_train, y_train, X_test, y_test, scaler = prepare_data(df, seq_length=best_params['seq_length'])
    y_test_inv = scaler.inverse_transform(
        np.concatenate([y_test.reshape(-1,1), np.zeros((len(y_test), len(features)-1))], axis=1)
    )[:, 0]
    
    test_pred = best_model.predict(X_test)
    test_pred_inv = scaler.inverse_transform(
        np.concatenate([test_pred, np.zeros((len(test_pred), len(features)-1))], axis=1)
    )[:, 0]
    
    plt.figure(figsize=(16, 8))
    plt.plot(y_test_inv, label='Valor Real')
    plt.plot(test_pred_inv, label='Previs√£o')
    plt.title(f'Previs√£o do Pre√ßo de Fechamento - {symbol} (Melhor Modelo)')
    plt.xlabel('Horas')
    plt.ylabel('Pre√ßo (R$)')
    plt.legend()
    plt.show()

| Ap√≥s o treinamento do modelo e a obten√ß√£o dos melhores resultados, √© fundamental salvar o modelo para que ele possa ser reutilizado posteriormente sem a necessidade de ser re-treinado. O formato .h5 √© amplamente utilizado em projetos que envolvem modelos Keras/TensorFlow, pois permite armazenar tanto a arquitetura quanto os pesos do modelo em um √∫nico arquivo. Isso facilita a implanta√ß√£o, compartilhamento e posterior an√°lise do modelo.

In [None]:
# Salvando o melhor modelo em formato HDF5 (.h5)
if best_model:
    best_model.save('../model/modelo_v1.h5')
    print("Modelo salvo com sucesso no arquivo 'best_lstm_model.h5'")
