# üöÄ LUMPS - Worker Distribuido para Google Colab

Este notebook permite ejecutar un worker distribuido para generar el dataset de la Fase 0 de LUMPS.

## üìã Instrucciones

1. **Ejecuta las celdas en orden**
2. **Configura tu ruta de Google Drive** en la celda de configuraci√≥n
3. **El worker trabajar√° autom√°ticamente** hasta que se desconecte Colab
4. **Puedes pausar/reanudar** usando los botones de control

## ‚ö†Ô∏è Importante
- Cada usuario debe hacer **"Archivo > Guardar una copia en Drive"** antes de ejecutar
- El worker trabajar√° en **loop continuo** hasta desconexi√≥n
- Los resultados se guardan autom√°ticamente en Google Drive compartido


## üîß Setup Inicial


In [None]:
# Montar Google Drive
from google.colab import drive
import os

print("üîó Montando Google Drive...")
drive.mount('/content/drive')
print("‚úÖ Google Drive montado exitosamente")


In [None]:
# Clonar repositorio desde GitHub
import subprocess
import sys
from pathlib import Path

print("üì• Clonando repositorio LUMPS...")

# Cambiar al directorio de trabajo
%cd /content

# Clonar repositorio (reemplaza con tu URL de GitHub)
repo_url = "https://github.com/juanignaciorey/LUMPS.git"  # ‚ö†Ô∏è CAMBIA ESTA URL
!git clone $repo_url

# Cambiar al directorio del proyecto
%cd LUMPS

print("‚úÖ Repositorio clonado exitosamente")
print(f"üìÅ Directorio actual: {os.getcwd()}")


In [None]:
# Instalar dependencias
print("üì¶ Instalando dependencias...")

# Instalar requirements
!pip install -r requirements.txt

# Instalar dependencias adicionales para Colab
!pip install tqdm

print("‚úÖ Dependencias instaladas exitosamente")


## ‚öôÔ∏è Configuraci√≥n


In [None]:
# Configurar paths y variables
import os
import socket
import time
from pathlib import Path

# ‚ö†Ô∏è CONFIGURAR ESTA RUTA - debe ser la carpeta compartida en Drive
DRIVE_BASE_PATH = "/content/drive/MyDrive/LUMPS_Distributed"

# Generar ID √∫nico para este worker
WORKER_ID = f"colab_{socket.gethostname()}_{os.getpid()}_{int(time.time())}"

# Configurar variables de entorno
os.environ['LUMPS_DRIVE_PATH'] = DRIVE_BASE_PATH
os.environ['WORKER_ID'] = WORKER_ID

print(f"üîß Configuraci√≥n:")
print(f"   Worker ID: {WORKER_ID}")
print(f"   Drive Path: {DRIVE_BASE_PATH}")
print(f"   Hostname: {socket.gethostname()}")
print(f"   PID: {os.getpid()}")

# Verificar que la ruta existe
if not Path(DRIVE_BASE_PATH).exists():
    print(f"‚ùå Error: La ruta {DRIVE_BASE_PATH} no existe")
    print("üí° Aseg√∫rate de que la carpeta compartida est√© en tu Drive")
else:
    print(f"‚úÖ Ruta verificada: {DRIVE_BASE_PATH}")


## üñ•Ô∏è Configuraci√≥n de GPU


In [None]:
# Verificar GPU disponible
import torch

print("üñ•Ô∏è Verificando GPU...")
print(f"   CUDA disponible: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"   GPU: {torch.cuda.get_device_name(0)}")
    print(f"   Memoria GPU: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")
    print("‚úÖ GPU configurada y lista")
else:
    print("‚ö†Ô∏è No hay GPU disponible, usando CPU")

print(f"   PyTorch versi√≥n: {torch.__version__}")


## üöÄ Ejecutar Worker


In [None]:
# Ejecutar worker distribuido
print("üöÄ Iniciando worker distribuido...")
print("‚ö†Ô∏è El worker trabajar√° en loop continuo hasta desconexi√≥n")
print("üõë Presiona el bot√≥n de interrumpir para detener")
print("\n" + "="*80)

# Ejecutar worker con TQDM para progreso visual
!python generate_dataset_distributed.py \
    --drive-path $LUMPS_DRIVE_PATH \
    --worker-id $WORKER_ID \
    --verbose
