# ü§ü Clasificador de Lengua de Se√±as Boliviana - Google Colab

Sistema de clasificaci√≥n de videos de lengua de se√±as usando Deep Learning, basado en la estrategia de **5 steps**.

## üìä Dataset

- **1,406 videos** de lengua de se√±as boliviana
- **71 clases** diferentes
- Videos cortos (~3 segundos promedio)
- Resoluci√≥n 1280x720

## üéØ Objetivos

Entrenar **2 modelos** de clasificaci√≥n:

1. **Lightweight**: Modelo r√°pido (~150K par√°metros) - 2-4 horas entrenamiento
2. **R(2+1)D**: Modelo de alta accuracy (~31M par√°metros) - 6-10 horas entrenamiento

---

## üìã Antes de empezar:

1. **Configura GPU**: Runtime ‚Üí Change runtime type ‚Üí **T4 GPU**
2. **Duraci√≥n**: ~8-14 horas para ambos modelos
3. **Espacio**: ~10-15GB necesarios

---

### ‚öôÔ∏è Hardware Recomendado:
- **GPU**: T4 (16GB VRAM) ‚úÖ RECOMENDADO
- **RAM**: 12GB High-RAM

**¬øPor qu√© T4 GPU?**
- Modelos 3D CNN optimizados para CUDA
- Mejor rendimiento que CPU para videos
- 16GB VRAM suficiente para ambos modelos

## üîß 1. Setup Inicial

In [None]:
# Verificar GPU disponible
!nvidia-smi

import torch
print(f"\n{'='*60}")
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    print(f"GPU Memory: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.2f} GB")
print(f"{'='*60}")

## üì¶ 2. Instalar Dependencias

In [None]:
# Instalar PyTorch con CUDA (optimizado para Colab T4)
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

In [None]:
# Instalar resto de dependencias
!pip install opencv-python pandas matplotlib seaborn scikit-learn tqdm -q

print("‚úÖ Instalaci√≥n completada")

## üíæ 3. Montar Google Drive

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# Crear directorios en Drive
import os
DRIVE_PATH = '/content/drive/MyDrive/LSB_Classifier'
os.makedirs(f"{DRIVE_PATH}/checkpoints_lightweight", exist_ok=True)
os.makedirs(f"{DRIVE_PATH}/checkpoints_r2plus1d", exist_ok=True)
os.makedirs(f"{DRIVE_PATH}/logs", exist_ok=True)
os.makedirs(f"{DRIVE_PATH}/data", exist_ok=True)

print(f"‚úÖ Google Drive montado en: {DRIVE_PATH}")

## üìÅ 4. Preparar Datos (usando estrategia 5 steps)

In [None]:
# Cambiar al directorio del proyecto clonado
%cd step5-lsb/codigo

print("üìÇ Cambiado a directorio del proyecto")
!pwd
!ls -la

In [None]:
# Crear enlace simb√≥lico a la carpeta videos en Drive
!ln -sf /content/drive/MyDrive/LSB_TAD/data/videos ../videos

print("‚úÖ Enlace simb√≥lico creado: ../videos -> /content/drive/MyDrive/LSB_TAD/data/videos")

In [None]:
# Copiar videos localmente para acelerar el entrenamiento
print("üöÄ COPIANDO VIDEOS LOCALMENTE PARA ACELERAR ENTRENAMIENTO...")
print("Esto tomar√° 5-10 minutos pero acelerar√° 6x el entrenamiento")

import os
import shutil
from pathlib import Path

LOCAL_VIDEOS = Path('/content/videos_local')
DRIVE_VIDEOS = Path('/content/drive/MyDrive/LSB_TAD/data/videos')

# Crear directorio local
LOCAL_VIDEOS.mkdir(exist_ok=True)

# Copiar videos
if DRIVE_VIDEOS.exists():
    print(f"üìÇ Copiando desde: {DRIVE_VIDEOS}")
    print(f"üìÇ Hacia: {LOCAL_VIDEOS}")
    
    # Copiar recursivamente
    shutil.copytree(DRIVE_VIDEOS, LOCAL_VIDEOS / 'videos', dirs_exist_ok=True)
    
    # Cambiar enlace simb√≥lico
    videos_link = Path('../videos')
    if videos_link.exists():
        videos_link.unlink()
    videos_link.symlink_to(LOCAL_VIDEOS / 'videos')
    
    print("‚úÖ Videos copiados localmente")
    print(f"üîó Enlace simb√≥lico actualizado: ../videos -> {LOCAL_VIDEOS / 'videos'}")
else:
    print("‚ùå No se encontr√≥ la carpeta de videos en Drive")
    print(f"   Verifica la ruta: {DRIVE_VIDEOS}")

print("üéØ Ahora el entrenamiento ser√° mucho m√°s r√°pido!")

In [None]:
# Paso 1: Analizar el dataset
print("üîç PASO 1: Analizando el dataset...")
!python step1_analizar_dataset.py

In [None]:
# Crear enlace simb√≥lico a la carpeta videos en Drive
!ln -sf /content/drive/MyDrive/LSB_TAD/data/videos ../videos

print("‚úÖ Enlace simb√≥lico creado: ../videos -> /content/drive/MyDrive/LSB_TAD/data/videos")

In [None]:
# Paso 2: Preparar los datos (dividir train/val/test)
print("\nüìä PASO 2: Preparando datos...")
!python step2_preparar_datos.py

In [None]:
# Paso 3: Crear dataset y probar DataLoader
print("\nüß™ PASO 3: Probando DataLoader...")
!python step3_crear_dataset.py

In [None]:
# Paso 4: Probar los modelos
print("\nüèóÔ∏è PASO 4: Probando modelos...")
!python step4_crear_modelo.py

## üöÄ 5. Entrenar Modelo 1: Lightweight (Recomendado para empezar)

### üìä Modelo Lightweight
- **Par√°metros**: ~150K
- **Tiempo estimado**: 2-4 horas
- **Accuracy esperado**: 60-75%
- **Ventajas**: R√°pido, poca memoria, ideal para pruebas

**Configuraci√≥n optimizada para GPU T4:**
- Batch size: 8 (acumulaci√≥n de gradientes)
- Learning rate: 0.001
- √âpocas: 30
- Frames por video: 8
- Resoluci√≥n: 112x112

In [None]:
# Entrenar modelo Lightweight
print("üöÄ ENTRENANDO MODELO LIGHTWEIGHT...")
print("‚è±Ô∏è Tiempo estimado: 2-4 horas")
print("üíæ Par√°metros: ~150K")
print("="*60)

!python step5_entrenar.py \
    --model lightweight \
    --epochs 30 \
    --batch_size 8 \
    --lr 0.001 \
    --patience 5 \
    --num_frames 8 \
    --frame_size 112

print("\n‚úÖ Entrenamiento Lightweight completado!")

## üöÄ 6. Entrenar Modelo 2: R(2+1)D (Alta Accuracy)

### üìä Modelo R(2+1)D
- **Par√°metros**: ~31M
- **Tiempo estimado**: 6-10 horas
- **Accuracy esperado**: 75-85%
- **Ventajas**: Mejor accuracy, arquitectura probada

**Configuraci√≥n optimizada para GPU T4:**
- Batch size: 4 (con acumulaci√≥n de gradientes)
- Learning rate: 0.001
- √âpocas: 20
- Frames por video: 16
- Resoluci√≥n: 224x224

In [None]:
# Entrenar modelo R(2+1)D
print("üöÄ ENTRENANDO MODELO R(2+1)D...")
print("‚è±Ô∏è Tiempo estimado: 6-10 horas")
print("üíæ Par√°metros: ~31M")
print("="*60)

!python step5_entrenar.py \
    --model r2plus1d \
    --epochs 20 \
    --batch_size 4 \
    --lr 0.001 \
    --patience 5 \
    --num_frames 16 \
    --frame_size 224

print("\n‚úÖ Entrenamiento R(2+1)D completado!")

## üìä 7. Evaluar Modelos

In [None]:
# Evaluar modelo Lightweight
print("üìä EVALUANDO MODELO LIGHTWEIGHT...")
!python step6_evaluar.py --model_path checkpoints_lightweight/best_model.pth

print("\n" + "="*60)

# Evaluar modelo R(2+1)D
print("üìä EVALUANDO MODELO R(2+1)D...")
!python step6_evaluar.py --model_path checkpoints_r2plus1d/best_model.pth

print("\n‚úÖ Evaluaci√≥n completada!")

## üîÆ 8. Hacer Predicciones

In [None]:
# Hacer predicci√≥n con un video de ejemplo
VIDEO_EJEMPLO = "../videos/1/SALUDOS/HOLA.mp4"  # Cambia esta ruta

print("üîÆ PREDICCI√ìN CON MODELO LIGHTWEIGHT:")
!python step7_predecir.py --model_path checkpoints_lightweight/best_model.pth --video_path "{VIDEO_EJEMPLO}"

print("\n" + "="*60)

print("üîÆ PREDICCI√ìN CON MODELO R(2+1)D:")
!python step7_predecir.py --model_path checkpoints_r2plus1d/best_model.pth --video_path "{VIDEO_EJEMPLO}"

print("\n‚úÖ Predicciones completadas!")

## üìà 9. Resumen y Pr√≥ximos Pasos

### üéØ Modelos Entrenados
1. **Lightweight**: Modelo r√°pido para pruebas y prototipos
2. **R(2+1)D**: Modelo de alta accuracy para producci√≥n

### üìä Resultados Esperados

| Modelo | Par√°metros | Tiempo | Accuracy | Uso |
|--------|------------|--------|----------|-----|
| Lightweight | ~150K | 2-4h | 60-75% | Pruebas r√°pidas |
| R(2+1)D | ~31M | 6-10h | 75-85% | Producci√≥n |

### üöÄ Pr√≥ximos Pasos
1. **Evaluaci√≥n detallada**: Comparar m√©tricas de ambos modelos
2. **Optimizaci√≥n**: Ajustar hiperpar√°metros si es necesario
3. **Despliegue**: Exportar modelo para inferencia en tiempo real
4. **Streaming**: Integrar con sistema de detecci√≥n temporal

### üí° Tips para Mejorar Accuracy
- Aumentar n√∫mero de √©pocas
- Usar data augmentation
- Probar diferentes learning rates
- Aumentar resoluci√≥n de frames (si hay memoria)

---

**¬°Felicitaciones! Has entrenado 2 modelos de clasificaci√≥n de lengua de se√±as usando la estrategia de 5 steps.** üéâ