# Flujo de Trabajo del Modelo de Correlación

Este notebook ejecuta el pipeline completo para el modelo de predicción de rentabilidad de acciones, desde la descarga de datos hasta la predicción final.

## Paso 1: Descarga de Datos Históricos

Ejecuta el script `batch_download.py` para descargar 5 años de datos históricos para todos los tickers listados en `nyse_tickers.csv`.

**Nota**: Este proceso puede tardar mucho tiempo dependiendo del número de tickers y la conexión.

In [None]:
!python ../batch_download.py

## Paso 2: Preparación y Enriquecimiento de Datos

Ejecuta el script `data_prep_correlation.py` para procesar los datos descargados.

Este script:
1. Normaliza los nombres de los tickers.
2. Calcula indicadores técnicos.
3. Calcula la rentabilidad de pares correlacionados.
4. Guarda el resultado en `all_enriched_data.csv`.

In [None]:
!python data_prep_correlation.py

## Paso 3: Entrenamiento del Modelo GRU

Ejecuta el script `train_correlation_model.py` para entrenar la red neuronal con los datos procesados.

Este script:
1. Carga los datos de `all_enriched_data.csv`.
2. Crea secuencias para el modelo GRU.
3. Entrena el modelo y guarda el mejor resultado en `correlation_model.h5`.
4. Genera una gráfica `training_loss.png` para diagnosticar el entrenamiento.

In [None]:
!python train_correlation_model.py

### Análisis de la Gráfica de Entrenamiento

La siguiente celda muestra la gráfica de las curvas de pérdida (`loss`) durante el entrenamiento. Es el indicador más importante para saber si el modelo ha aprendido correctamente.

- **Pérdida de Entrenamiento (azul)**: El error del modelo sobre los datos que ha visto.
- **Pérdida de Validación (naranja)**: El error del modelo sobre datos nuevos. **Esta es la métrica más importante.**

Buscamos que ambas curvas desciendan y que la de validación se estabilice en un valor bajo.

In [None]:
from IPython.display import Image

try:
    display(Image(filename='training_loss.png'))
except FileNotFoundError:
    print("No se encontró la imagen 'training_loss.png'. Asegúrate de que el paso de entrenamiento se completó sin errores.")

## Paso 4: Predicción del Top 5

Finalmente, ejecuta `predict_top_5.py` para cargar el modelo entrenado y predecir qué 5 tickers tienen la mayor probabilidad de rentabilidad en los próximos 5 días.

In [None]:
!python predict_top_5.py