# üöÄ Safety Vision AI - Entrenamiento en Google Colab
## YOLOv8 Fine-Tuning para Detecci√≥n de EPP

**Dataset:** Hard Hat Detection (5,269 im√°genes)
**Clases:** head, helmet, person
**Tiempo estimado con GPU T4:** 40-80 minutos

---

### üìã INSTRUCCIONES ANTES DE EMPEZAR:

1. **Activar GPU:**
   - Menu: `Runtime` ‚Üí `Change runtime type`
   - Hardware accelerator: **T4 GPU**
   - Clic en **Save**

2. **Preparar dataset:**
   - Necesitas subir el archivo ZIP del dataset
   - O tenerlo en Google Drive

3. **Ejecutar celdas en orden:**
   - Presiona `Shift + Enter` en cada celda
   - O usa: `Runtime` ‚Üí `Run all`

## 1Ô∏è‚É£ Verificar GPU y Instalar Ultralytics

In [None]:
# Instalar Ultralytics
!pip install ultralytics -q

# Verificar GPU
import torch
print("="*60)
print("üî• VERIFICACI√ìN DE GPU")
print("="*60)
print(f"‚úÖ PyTorch version: {torch.__version__}")
print(f"‚úÖ CUDA disponible: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"‚úÖ GPU: {torch.cuda.get_device_name(0)}")
    print(f"‚úÖ Memoria GPU: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")
    print("\nüöÄ ¬°PERFECTO! Entrenar√°s con GPU")
else:
    print("\n‚ö†Ô∏è  WARNING: No GPU detectada")
    print("Ve a: Runtime ‚Üí Change runtime type ‚Üí T4 GPU")

## 2Ô∏è‚É£ Montar Google Drive (Opci√≥n A - RECOMENDADA)

**Usa esta opci√≥n si subiste el dataset a Google Drive**

In [None]:
# Montar Google Drive
from google.colab import drive
drive.mount('/content/drive')

print("‚úÖ Google Drive montado")
print("\nüìÅ Ahora sube tu carpeta 'helmet_vest_detection' a:")
print("   /content/drive/MyDrive/Safety-Vision-AI/")

## 2Ô∏è‚É£-B Subir ZIP directamente (Opci√≥n B - Alternativa)

**Usa esta opci√≥n si tienes el dataset en un archivo ZIP**

**IMPORTANTE:** Primero comprime tu dataset localmente:
```powershell
# En tu PC, ejecuta:
cd C:\Users\LENOVO\OneDrive\Documentos\SISTEMASCORE\PROYECTOS\Safety-Vision-AI\datasets
Compress-Archive -Path "helmet_vest_detection\*" -DestinationPath "helmet_vest_detection.zip"
```

In [None]:
# SOLO SI USAS OPCI√ìN B (subir ZIP)
from google.colab import files
import zipfile

print("üì§ Sube el archivo helmet_vest_detection.zip")
print("‚è∞ Esto tomar√° 5-10 minutos dependiendo de tu conexi√≥n...\n")

uploaded = files.upload()

# Descomprimir
for filename in uploaded.keys():
    if filename.endswith('.zip'):
        print(f"\nüì¶ Descomprimiendo {filename}...")
        with zipfile.ZipFile(filename, 'r') as zip_ref:
            zip_ref.extractall('dataset')
        print("‚úÖ Dataset descomprimido en /content/dataset/")

## 3Ô∏è‚É£ Configurar Paths del Dataset

In [None]:
from pathlib import Path

# ‚ö†Ô∏è ELIGE UNA OPCI√ìN:

# OPCI√ìN A: Si usaste Google Drive
dataset_path = Path('/content/drive/MyDrive/Safety-Vision-AI/helmet_vest_detection')

# OPCI√ìN B: Si subiste ZIP directamente
# dataset_path = Path('/content/dataset')

# Verificar que existe
if not dataset_path.exists():
    print(f"‚ùå ERROR: No se encontr√≥ el dataset en {dataset_path}")
    print("\nVerifica la ruta o sube el dataset primero")
else:
    print(f"‚úÖ Dataset encontrado en: {dataset_path}")
    
    # Contar im√°genes
    train_images = list((dataset_path / 'train' / 'images').glob('*.jpg'))
    test_images = list((dataset_path / 'test' / 'images').glob('*.jpg'))
    
    print(f"\nüìä ESTAD√çSTICAS:")
    print(f"   üîπ Im√°genes de entrenamiento: {len(train_images):,}")
    print(f"   üîπ Im√°genes de validaci√≥n: {len(test_images):,}")
    print(f"   üîπ Total: {len(train_images) + len(test_images):,}")

## 4Ô∏è‚É£ Crear archivo data.yaml

In [None]:
# Crear data.yaml
yaml_content = f"""
path: {dataset_path}
train: train/images
val: test/images

nc: 3
names: ['head', 'helmet', 'person']
"""

yaml_path = Path('/content/data.yaml')
yaml_path.write_text(yaml_content)

print("‚úÖ data.yaml creado:")
print(yaml_content)

## 5Ô∏è‚É£ üî• ENTRENAR EL MODELO

### ‚è∞ Tiempo estimado: 40-80 minutos con GPU T4

**IMPORTANTE:** 
- No cierres esta pesta√±a mientras entrena
- Puedes ver el progreso en tiempo real
- Si se interrumpe, puedes reanudar desde el checkpoint

In [None]:
from ultralytics import YOLO
from datetime import datetime

print("="*70)
print("üöÄ INICIANDO ENTRENAMIENTO")
print("="*70)

start_time = datetime.now()
print(f"\n‚è∞ Inicio: {start_time.strftime('%Y-%m-%d %H:%M:%S')}\n")

# Cargar modelo base
model = YOLO('yolov8n.pt')

# Configuraci√≥n de entrenamiento
results = model.train(
    data='/content/data.yaml',
    epochs=50,              # 50 epochs = excelentes resultados
    imgsz=640,              # Tama√±o de imagen
    batch=32,               # GPU puede manejar batch m√°s grande
    device=0,               # GPU
    project='/content/runs',
    name='helmet_detection',
    patience=10,            # Early stopping
    save=True,
    plots=True,
    
    # Data augmentation
    hsv_h=0.015,
    hsv_s=0.7,
    hsv_v=0.4,
    degrees=10.0,
    translate=0.1,
    scale=0.5,
    flipud=0.0,
    fliplr=0.5,
)

end_time = datetime.now()
duration = end_time - start_time

print("\n" + "="*70)
print("üéâ ¬°ENTRENAMIENTO COMPLETADO!")
print("="*70)
print(f"\n‚è∞ Duraci√≥n total: {duration}")
print(f"‚è∞ Finalizado: {end_time.strftime('%Y-%m-%d %H:%M:%S')}")

## 6Ô∏è‚É£ Evaluar el Modelo

In [None]:
# Evaluar en conjunto de validaci√≥n
print("\nüìä EVALUANDO MODELO...\n")

metrics = model.val()

print("\n" + "="*70)
print("üìà M√âTRICAS FINALES")
print("="*70)
print(f"\nüéØ mAP@0.5:        {metrics.box.map50:.4f}")
print(f"üéØ mAP@0.5:0.95:   {metrics.box.map:.4f}")
print(f"üéØ Precision:      {metrics.box.mp:.4f}")
print(f"üéØ Recall:         {metrics.box.mr:.4f}")

# Verificar objetivo
if metrics.box.map50 >= 0.75:
    print("\n‚úÖ ¬°EXCELENTE! El modelo cumple el objetivo (mAP@0.5 >= 0.75)")
else:
    print(f"\n‚ö†Ô∏è  mAP@0.5 = {metrics.box.map50:.4f} (objetivo: >= 0.75)")
    print("Considera entrenar m√°s epochs o ajustar hiperpar√°metros")

## 7Ô∏è‚É£ Visualizar Curvas de Entrenamiento

In [None]:
import matplotlib.pyplot as plt
from PIL import Image

# Mostrar gr√°fica de resultados
results_img = Path('/content/runs/helmet_detection/results.png')

if results_img.exists():
    img = Image.open(results_img)
    plt.figure(figsize=(16, 10))
    plt.imshow(img)
    plt.axis('off')
    plt.title('Curvas de Entrenamiento', fontsize=18, fontweight='bold')
    plt.tight_layout()
    plt.show()
    
    print("\n‚úÖ Gr√°ficas mostradas correctamente")
else:
    print("‚ö†Ô∏è  No se encontr√≥ la gr√°fica de resultados")

## 8Ô∏è‚É£ Probar el Modelo en Im√°genes

In [None]:
import random

# Cargar el mejor modelo
best_model_path = '/content/runs/helmet_detection/weights/best.pt'
best_model = YOLO(best_model_path)

# Seleccionar im√°genes aleatorias de validaci√≥n
test_images_list = list((dataset_path / 'test' / 'images').glob('*.jpg'))
sample_images = random.sample(test_images_list, min(6, len(test_images_list)))

print("üéØ PREDICCIONES EN IM√ÅGENES DE VALIDACI√ìN:\n")

fig, axes = plt.subplots(2, 3, figsize=(18, 12))
axes = axes.flatten()

for idx, img_path in enumerate(sample_images):
    # Hacer predicci√≥n
    results = best_model(str(img_path), verbose=False)
    
    # Dibujar predicciones
    annotated = results[0].plot()
    
    # Mostrar
    axes[idx].imshow(annotated[..., ::-1])  # BGR to RGB
    axes[idx].set_title(f"Predicci√≥n {idx+1}", fontsize=14, fontweight='bold')
    axes[idx].axis('off')
    
    # Imprimir detecciones
    print(f"Imagen {idx+1}: {img_path.name}")
    for box in results[0].boxes:
        cls = int(box.cls[0])
        conf = float(box.conf[0])
        name = results[0].names[cls]
        print(f"  ‚û§ {name}: {conf:.2f}")
    print()

plt.tight_layout()
plt.suptitle('Predicciones del Modelo Entrenado', fontsize=18, fontweight='bold', y=1.02)
plt.show()

## 9Ô∏è‚É£ üíæ DESCARGAR EL MODELO ENTRENADO

**IMPORTANTE:** Descarga estos archivos antes de cerrar Colab

In [None]:
from google.colab import files
import shutil

print("üì• DESCARGANDO ARCHIVOS...\n")

# 1. Copiar el mejor modelo con nombre descriptivo
best_model = Path('/content/runs/helmet_detection/weights/best.pt')
if best_model.exists():
    # Renombrar con informaci√≥n de m√©tricas
    model_name = f'yolov8_helmet_vest_best_mAP{metrics.box.map50:.3f}.pt'
    shutil.copy(best_model, f'/content/{model_name}')
    
    print(f"1Ô∏è‚É£ Descargando modelo entrenado: {model_name}")
    files.download(f'/content/{model_name}')
    print(f"   ‚úÖ Modelo descargado ({best_model.stat().st_size / (1024*1024):.2f} MB)\n")

# 2. Descargar gr√°ficas de entrenamiento
results_png = Path('/content/runs/helmet_detection/results.png')
if results_png.exists():
    shutil.copy(results_png, '/content/training_results.png')
    print("2Ô∏è‚É£ Descargando gr√°ficas de entrenamiento")
    files.download('/content/training_results.png')
    print("   ‚úÖ Gr√°ficas descargadas\n")

# 3. Descargar matriz de confusi√≥n
confusion_matrix = Path('/content/runs/helmet_detection/confusion_matrix.png')
if confusion_matrix.exists():
    shutil.copy(confusion_matrix, '/content/confusion_matrix.png')
    print("3Ô∏è‚É£ Descargando matriz de confusi√≥n")
    files.download('/content/confusion_matrix.png')
    print("   ‚úÖ Matriz de confusi√≥n descargada\n")

print("="*70)
print("‚úÖ TODOS LOS ARCHIVOS DESCARGADOS")
print("="*70)
print("\nüìÅ Guarda estos archivos en tu proyecto local:")
print("   models_assets/yolov8_helmet_vest_best.pt")

## üîü Resumen Final y Pr√≥ximos Pasos

In [None]:
print("\n" + "="*70)
print("üéâ FASE 1 COMPLETADA - FINE-TUNING EXITOSO")
print("="*70)

print("\nüìä RESUMEN:")
print(f"   üîπ Dataset: {len(train_images):,} im√°genes de entrenamiento")
print(f"   üîπ Modelo: YOLOv8n")
print(f"   üîπ Epochs: 50")
print(f"   üîπ Duraci√≥n: {duration}")
print(f"   üîπ mAP@0.5: {metrics.box.map50:.4f}")
print(f"   üîπ Precision: {metrics.box.mp:.4f}")
print(f"   üîπ Recall: {metrics.box.mr:.4f}")

print("\n‚úÖ ARCHIVOS DESCARGADOS:")
print(f"   üìÅ {model_name}")
print(f"   üìÅ training_results.png")
print(f"   üìÅ confusion_matrix.png")

print("\nüöÄ PR√ìXIMOS PASOS EN TU PC:")
print("\n1Ô∏è‚É£ Mover el modelo a tu proyecto:")
print("   - Copia el archivo .pt descargado a:")
print("     C:\\Users\\LENOVO\\OneDrive\\Documentos\\SISTEMASCORE\\PROYECTOS\\")
print("     Safety-Vision-AI\\models_assets\\yolov8_helmet_vest_best.pt")

print("\n2Ô∏è‚É£ Commitear a GitHub:")
print("   git add models_assets/yolov8_helmet_vest_best.pt")
print(f"   git commit -m 'feat: train YOLOv8 model with mAP={metrics.box.map50:.3f}'")
print("   git push")

print("\n3Ô∏è‚É£ Continuar con FASE 2:")
print("   - Pipeline de Inferencia en Tiempo Real")
print("   - Detecci√≥n en video")
print("   - L√≥gica de seguridad")

print("\n" + "="*70)
print("üéä ¬°EXCELENTE TRABAJO MANITO! üéä")
print("="*70)