# YOLOv8 Fine-Tuning para Detecci√≥n de EPP
## Safety Vision AI - Hard Hat Detection

**Dataset:** Hard Hat Detection (5,269 training images)
**Clases:** head, helmet, person
**Fecha:** 2026-01-28

## 1Ô∏è‚É£ Imports y Verificaciones

In [None]:
from ultralytics import YOLO
import torch
import os
from pathlib import Path
import matplotlib.pyplot as plt
from PIL import Image

print(f"‚úÖ PyTorch version: {torch.__version__}")
print(f"‚úÖ CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"‚úÖ CUDA device: {torch.cuda.get_device_name(0)}")
    print(f"‚úÖ CUDA version: {torch.version.cuda}")
else:
    print("‚ö†Ô∏è  Running on CPU (esto ser√° m√°s lento pero funcional)")

## 2Ô∏è‚É£ Verificar Dataset

In [None]:
# Verificar dataset
dataset_path = Path("../datasets/helmet_vest_detection")
data_yaml = dataset_path / "data.yaml"

if not data_yaml.exists():
    print("‚ùå ERROR: No se encontr√≥ data.yaml")
    print(f"Verifica que el dataset est√© en: {dataset_path}")
else:
    print(f"‚úÖ Dataset encontrado: {data_yaml}")
    
    # Contar im√°genes
    train_images = list((dataset_path / "train" / "images").glob("*.jpg")) + \
                   list((dataset_path / "train" / "images").glob("*.png"))
    test_images = list((dataset_path / "test" / "images").glob("*.jpg")) + \
                   list((dataset_path / "test" / "images").glob("*.png"))
    
    print(f"\nüìä ESTAD√çSTICAS DEL DATASET:")
    print(f"   üîπ Im√°genes de entrenamiento: {len(train_images):,}")
    print(f"   üîπ Im√°genes de validaci√≥n: {len(test_images):,}")
    print(f"   üîπ Total: {len(train_images) + len(test_images):,}")
    
    # Verificar labels
    train_labels = list((dataset_path / "train" / "labels").glob("*.txt"))
    print(f"\nüìù Labels de entrenamiento: {len(train_labels):,}")
    
    if len(train_images) > 0:
        print(f"\n‚úÖ Dataset listo para entrenar!")
    else:
        print("\n‚ùå No se encontraron im√°genes")

## 3Ô∏è‚É£ Visualizar Muestras del Dataset

In [None]:
# Visualizar algunas im√°genes de ejemplo
import random

if len(train_images) > 0:
    # Seleccionar 6 im√°genes aleatorias
    sample_images = random.sample(train_images, min(6, len(train_images)))
    
    fig, axes = plt.subplots(2, 3, figsize=(15, 10))
    axes = axes.flatten()
    
    for idx, img_path in enumerate(sample_images):
        img = Image.open(img_path)
        axes[idx].imshow(img)
        axes[idx].set_title(f"Imagen {idx+1}\n{img_path.name}")
        axes[idx].axis('off')
    
    plt.tight_layout()
    plt.suptitle('Muestras del Dataset de Entrenamiento', fontsize=16, y=1.02)
    plt.show()
else:
    print("No hay im√°genes para visualizar")

## 4Ô∏è‚É£ Cargar Modelo Base YOLOv8

In [None]:
# Cargar modelo base pre-entrenado
# Opciones: yolov8n.pt (nano), yolov8s.pt (small), yolov8m.pt (medium)
# Recomendado: yolov8n.pt para empezar (m√°s r√°pido)

model = YOLO('yolov8n.pt')
print("‚úÖ Modelo base YOLOv8n cargado correctamente")
print(f"üìä Par√°metros del modelo: {sum(p.numel() for p in model.model.parameters()):,}")

## 5Ô∏è‚É£ Configuraci√≥n de Entrenamiento

In [None]:
# Configuraci√≥n de hiperpar√°metros
CONFIG = {
    'data': str(data_yaml),
    'epochs': 50,              # N√∫mero de epochs (min 30, ideal 50-100)
    'imgsz': 640,              # Tama√±o de imagen
    'batch': 16,               # Batch size (reducir si hay error de memoria: 8, 4, 2)
    'device': 0,               # 0 = GPU, 'cpu' = CPU
    'project': '../models_assets',
    'name': 'yolov8_helmet_detection',
    'patience': 10,            # Early stopping
    'save': True,
    'plots': True,
    'workers': 8,              # N√∫mero de workers para cargar datos
    'cache': False,            # Cache de im√°genes (True si tienes RAM suficiente)
    
    # Data Augmentation
    'hsv_h': 0.015,
    'hsv_s': 0.7,
    'hsv_v': 0.4,
    'degrees': 10.0,           # Rotaci√≥n
    'translate': 0.1,          # Traslaci√≥n
    'scale': 0.5,              # Escalado
    'flipud': 0.0,             # Flip vertical
    'fliplr': 0.5,             # Flip horizontal
}

print("‚öôÔ∏è  CONFIGURACI√ìN DE ENTRENAMIENTO:")
for key, value in CONFIG.items():
    print(f"   {key}: {value}")

## 6Ô∏è‚É£ ENTRENAR EL MODELO üöÄ

‚è∞ **Tiempo estimado:**
- Con GPU: 40-80 minutos (50 epochs)
- Con CPU: 4-8 horas (no recomendado)

**Nota:** Puedes detener en cualquier momento con el bot√≥n Stop. El mejor modelo se guarda autom√°ticamente.

In [None]:
# ENTRENAR
print("\n" + "="*60)
print("üöÄ INICIANDO ENTRENAMIENTO...")
print("="*60 + "\n")

results = model.train(**CONFIG)

print("\n" + "="*60)
print("üéâ ¬°ENTRENAMIENTO COMPLETADO!")
print("="*60)

## 7Ô∏è‚É£ Evaluar el Modelo

In [None]:
# Evaluar en el conjunto de validaci√≥n
print("\nüìä EVALUANDO MODELO...\n")
metrics = model.val()

print("\n" + "="*60)
print("üìà M√âTRICAS DEL MODELO:")
print("="*60)
print(f"\nüéØ mAP@0.5:        {metrics.box.map50:.4f}")
print(f"üéØ mAP@0.5:0.95:   {metrics.box.map:.4f}")
print(f"üéØ Precision:      {metrics.box.mp:.4f}")
print(f"üéØ Recall:         {metrics.box.mr:.4f}")

# Evaluaci√≥n por clase
print("\nüìä M√âTRICAS POR CLASE:")
class_names = ['head', 'helmet', 'person']
for i, name in enumerate(class_names):
    if hasattr(metrics.box, 'maps'):
        print(f"   {name}: mAP@0.5 = {metrics.box.maps[i]:.4f}")

## 8Ô∏è‚É£ Guardar el Mejor Modelo

In [None]:
import shutil

# Ubicaci√≥n del mejor modelo
best_model_path = Path("../models_assets/yolov8_helmet_detection/weights/best.pt")

if best_model_path.exists():
    # Copiar a una ubicaci√≥n m√°s accesible
    destination = Path("../models_assets/yolov8_helmet_vest_best.pt")
    shutil.copy(best_model_path, destination)
    
    print("\n" + "="*60)
    print("üíæ MODELO GUARDADO")
    print("="*60)
    print(f"\n‚úÖ Mejor modelo guardado en: {destination}")
    print(f"üìÅ Tama√±o del archivo: {destination.stat().st_size / (1024*1024):.2f} MB")
    print(f"\nüìÇ Archivos del entrenamiento en:")
    print(f"   {best_model_path.parent.parent}")
else:
    print("\n‚ùå No se encontr√≥ el modelo entrenado")
    print(f"Buscado en: {best_model_path}")

## 9Ô∏è‚É£ Visualizar Curvas de Entrenamiento

In [None]:
# Mostrar gr√°ficas de entrenamiento
results_path = Path("../models_assets/yolov8_helmet_detection")

if results_path.exists():
    # Buscar imagen de resultados
    results_img = results_path / "results.png"
    
    if results_img.exists():
        print("\nüìä CURVAS DE ENTRENAMIENTO:\n")
        img = Image.open(results_img)
        plt.figure(figsize=(16, 10))
        plt.imshow(img)
        plt.axis('off')
        plt.title('M√©tricas de Entrenamiento', fontsize=16)
        plt.tight_layout()
        plt.show()
    else:
        print("‚ö†Ô∏è  Gr√°fica de resultados no encontrada")
else:
    print("‚ö†Ô∏è  Carpeta de resultados no encontrada")

## üîü Probar el Modelo en Im√°genes de Validaci√≥n

In [None]:
# Cargar el mejor modelo y probar
if destination.exists() and len(test_images) > 0:
    print("\nüéØ PROBANDO EL MODELO EN IM√ÅGENES DE VALIDACI√ìN\n")
    
    # Cargar mejor modelo
    best_model = YOLO(str(destination))
    
    # Seleccionar 6 im√°genes aleatorias del conjunto de validaci√≥n
    sample_test_images = random.sample(test_images, min(6, len(test_images)))
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    axes = axes.flatten()
    
    for idx, img_path in enumerate(sample_test_images):
        # Hacer predicci√≥n
        results = best_model(str(img_path), verbose=False)
        
        # Dibujar predicciones
        annotated = results[0].plot()
        
        # Mostrar
        axes[idx].imshow(annotated[..., ::-1])  # BGR to RGB
        axes[idx].set_title(f"Predicci√≥n {idx+1}", fontsize=12)
        axes[idx].axis('off')
        
        # Imprimir detecciones
        print(f"\nImagen {idx+1}: {img_path.name}")
        for box in results[0].boxes:
            cls = int(box.cls[0])
            conf = float(box.conf[0])
            name = results[0].names[cls]
            print(f"  ‚û§ {name}: {conf:.2f}")
    
    plt.tight_layout()
    plt.suptitle('Predicciones del Modelo en Im√°genes de Validaci√≥n', fontsize=16, y=1.02)
    plt.show()
else:
    print("‚ö†Ô∏è  No se pudo probar el modelo")

## ‚úÖ RESUMEN FINAL

In [None]:
print("\n" + "="*70)
print("üéâ FASE 1 COMPLETADA - FINE-TUNING EXITOSO")
print("="*70)

if destination.exists():
    print("\n‚úÖ MODELO ENTRENADO Y GUARDADO:")
    print(f"   üìÅ Ubicaci√≥n: {destination}")
    print(f"   üíæ Tama√±o: {destination.stat().st_size / (1024*1024):.2f} MB")
    
    print("\nüìä DATASET UTILIZADO:")
    print(f"   üîπ Entrenamiento: {len(train_images):,} im√°genes")
    print(f"   üîπ Validaci√≥n: {len(test_images):,} im√°genes")
    print(f"   üîπ Clases: head, helmet, person")
    
    print("\nüéØ PR√ìXIMOS PASOS:")
    print("   1Ô∏è‚É£ Revisar m√©tricas (mAP debe ser > 0.75)")
    print("   2Ô∏è‚É£ Commitear cambios a Git")
    print("   3Ô∏è‚É£ Continuar con FASE 2: Pipeline de Inferencia")
    
    print("\nüí° COMANDOS PARA GIT:")
    print("   git add .")
    print(f"   git commit -m 'feat: train YOLOv8 model with mAP={metrics.box.map50:.3f}'")
    print("   git push")
    
    print("\nüöÄ ¬°EXCELENTE TRABAJO!")
    print("="*70 + "\n")
else:
    print("\n‚ö†Ô∏è  Revisa que el entrenamiento haya completado correctamente")