In [1]:
# Modelo YOLO Version 3 para detección de objetos (celdas de sangre)
# Basado en el repositorio de Manuel Garcia UEM Junio 2025

#1. Reproducibilidad total

import random
import numpy as np
import torch

SEED = 1234
random.seed(SEED)
np.random.seed(SEED)
torch.manual_seed(SEED)
if torch.cuda.is_available():
    torch.cuda.manual_seed_all(SEED)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False
print(f"Semilla global fijada en {SEED}")

Semilla global fijada en 1234


In [2]:
# Modelo YOLO Version 3 para detección de objetos (celdas de sangre)
# Basado en el repositorio de Manuel Garcia UEM Junio 2025

# Ruta al repositorio 
# C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/

# Ruta al fichero de configuracion yolov3.cfg
#C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/config

# Ruta a los pesos preentrenados yolov3.weights
# C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/weights/

# Importamos librerias

import torch
import torch.nn as nn
import sys
import os
import numpy as np 

from torch.utils.data import Dataset, DataLoader
from torch.utils.tensorboard import SummaryWriter

import cv2
import albumentations as A
from albumentations.pytorch import ToTensorV2
import pandas as pd
from sklearn.model_selection import train_test_split

import torch.optim as optim
import torch.nn.functional as F

from tqdm import tqdm 

print("Liberias importadas correctamente")

Liberias importadas correctamente


In [3]:
# Verificamos que PyTorch está instalado y la versión
print(f"Versión de PyTorch: {torch.__version__}")

# Verificamos que NumPy está instalado y la versión
print(f"Versión de NumPy: {np.__version__}")

# Verificamos que sys está instalado y la versión
print(f"Versión de sys: {sys.version}")
# Verificamos que os está instalado y la versión
print(f"Versión de os: {os.name}")
# Verificamos que la GPU está disponible (si es que se va a usar)
if torch.cuda.is_available():
    print("GPU disponible para PyTorch.")
    print(f"Dispositivo actual: {torch.cuda.get_device_name(0)}")
else:
    print("No se detecta GPU, se usará la CPU para el entrenamiento.")

# Detección del Dispositivo (CPU o GPU)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"Trabajando en el dispositivo: {device}")

Versión de PyTorch: 2.3.1
Versión de NumPy: 1.26.4
Versión de sys: 3.12.9 | packaged by Anaconda, Inc. | (main, Feb  6 2025, 18:49:16) [MSC v.1929 64 bit (AMD64)]
Versión de os: nt
No se detecta GPU, se usará la CPU para el entrenamiento.
Trabajando en el dispositivo: cpu


In [4]:
# Configuración de rutas
# Ruta donde hemos clonado el repositorio de Erik Lindernoren.
YOLOV3_REPO_PATH = 'C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/'
YOLOV3_MODELS_PATH = os.path.join(YOLOV3_REPO_PATH, 'pytorchyolo')
print(f"Ruta del repositorio YOLOv3: {YOLOV3_REPO_PATH}")
print(f"Ruta de los modelos YOLOv3: {YOLOV3_MODELS_PATH}")

# Rutas de Archivos Específicos
# Archivo de configuracion yolov3.cfg
CONFIG_PATH = os.path.join(YOLOV3_REPO_PATH, 'config', 'yolov3.cfg')
CONFIG_PATH = CONFIG_PATH.replace('\\', '/')  # Asegúrate de usar barras normales para evitar problemas en Linux/Mac
print(f"Ruta del archivo de configuración YOLOv3: {CONFIG_PATH}")

# Archivo de pesos .weights descargado de https://github.com/patrick013/Object-Detection---Yolov3.git
WEIGHTS_PATH = os.path.join(YOLOV3_REPO_PATH, 'yolov3.weights')
WEIGHTS_PATH = WEIGHTS_PATH.replace('\\', '/')  # Asegúrate de usar barras normales para evitar problemas en Linux/Mac
print(f"Ruta del archivo de pesos YOLOv3: {WEIGHTS_PATH}")

# Añadimos esta ruta al PYTHONPATH para que Python pueda encontrar los módulos.
sys.path.append(YOLOV3_REPO_PATH)
sys.path.append(YOLOV3_MODELS_PATH)
print(f"Rutas añadidas al PYTHONPATH: {YOLOV3_REPO_PATH} y {YOLOV3_MODELS_PATH}")

# Importamos las clases necesarias del repositorio.
# Darknet y YOLOLayer son las clases principales del modelo.
from models import Darknet, YOLOLayer 

Ruta del repositorio YOLOv3: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/
Ruta de los modelos YOLOv3: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/pytorchyolo
Ruta del archivo de configuración YOLOv3: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/config/yolov3.cfg
Ruta del archivo de pesos YOLOv3: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/yolov3.weights
Rutas añadidas al PYTHONPATH: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/ y C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/pytorchyolo


In [5]:
# Definicion del modelo
    
# Parámetros Generales
# Número de clases del dataset BCCD (Glóbulos Rojos, Glóbulos Blancos, Plaquetas).
NUM_CLASSES_YOUR_DATASET = 3
# Tamaño de la imagen de entrada para el modelo YOLOv3 (típicamente 416x416 o 608x608).
IMG_SIZE = 416 

# Definimos los anchor masks para tus 3 clases (placeholder hasta definir los adecuados con KMeans)
# YOLOv3 usa 9 anchor boxes en total, divididos en 3 grupos de 3 para cada escala.
# Estos son los INDICES de los anchors. Los valores reales los calculaamos con K-Means.
# Ejemplo: si los 9 anchors se ordenan de menor a mayor área, los grandes (indices 6,7,8) van a la escala 13x13.
#Anchor Boxes Calculadas (Formato para YOLOv3Loss): [[(227, 210), (179, 155), (124, 111)], [(105, 113), (104, 96), (80, 109)], [(112, 75), (87, 82), (39, 38)]]

ANCHORS = [
    [(227, 210), (179, 155), (124, 111)],  # Anchors para la escala más grande (stride 32, detecta objetos grandes)
    [(105, 113), (104, 96), (80, 109)],    # Anchors para la escala media (stride 16, detecta objetos medianos)
    [(112, 75), (87, 82), (39, 38)]        # Anchors para la escala más pequeña (stride 8, detecta objetos pequeños)
]


# Rutas de Archivos Específicos
# Archivo de configuracion yolov3.cfg
CONFIG_PATH = os.path.join(YOLOV3_REPO_PATH, 'config', 'yolov3.cfg')
CONFIG_PATH = CONFIG_PATH.replace('\\', '/')  # Asegúrate de usar barras normales para evitar problemas en Linux/Mac

# Archivo de pesos .weights descargado de https://github.com/patrick013/Object-Detection---Yolov3.git
WEIGHTS_PATH = os.path.join(YOLOV3_REPO_PATH, 'yolov3.weights')
WEIGHTS_PATH = WEIGHTS_PATH.replace('\\', '/')  # Asegúrate de usar barras normales para evitar problemas en Linux/Mac

# Detección del Dispositivo (CPU o GPU)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"Trabajando en el dispositivo: {device}")

# PASO 1: Instanciar el Modelo YOLOv3 (para 80 clases, usando el .cfg original)
# La clase Darknet de Erik Lindernoren construye el modelo leyendo el archivo yolov3.cfg.
# Esto crea el modelo con la arquitectura esperada por el archivo yolov3.weights.
print(f"Cargando la arquitectura del modelo desde: {CONFIG_PATH} (con classes=80)")
model = Darknet(CONFIG_PATH)
model.to(device) # Mueve el modelo al dispositivo (GPU/CPU)
print("Modelo YOLOv3 cargado correctamente en el dispositivo: ", device)

# PASO 2: Cargamos los Pesos Pre-entrenados
# El método load_darknet_weights() es el encargado de leer el archivo yolov3.weights.
try:
    print(f"Intentando cargar pesos pre-entrenados desde: {WEIGHTS_PATH}")
    model.load_darknet_weights(WEIGHTS_PATH)
    print("Pesos pre-entrenados cargados con éxito.")

except FileNotFoundError:
    print(f"ERROR: No se encontró el archivo de pesos en {WEIGHTS_PATH}.")
    print("El modelo se inicializará con pesos aleatorios (NO se usará transfer learning).")
    print("¡ADVERTENCIA! Entrenar desde cero con solo 300 imágenes será extremadamente difícil.")
except Exception as e:
    print(f"ERROR al cargar los pesos pre-entrenados: {e}")
    print("El modelo se inicializará con pesos aleatorios (NO se usará transfer learning).")
    print("¡ADVERTENCIA! Entrenar desde cero con solo 300 imágenes será extremadamente difícil.")

# ... (all your setup code above remains unchanged)

# PASO 3: Adaptacion del modelo para las 3 clases (FINE-TUNING EN MEMORIA)
print("\nAdaptando las capas de predicción a 3 clases...")

yolo_layer_index_in_model_yolo_layers = 0
for i, module_def in enumerate(model.module_defs):
    if module_def["type"] == "yolo":
        pred_conv_sequential_idx = i - 1
        pred_conv_layer_old = model.module_list[pred_conv_sequential_idx][0]
        yolo_layer_old_instance = model.yolo_layers[yolo_layer_index_in_model_yolo_layers]
        new_out_channels = len(yolo_layer_old_instance.anchors) * (5 + NUM_CLASSES_YOUR_DATASET)
        new_pred_conv_layer = nn.Conv2d(pred_conv_layer_old.in_channels, new_out_channels,
                                        kernel_size=pred_conv_layer_old.kernel_size,
                                        stride=pred_conv_layer_old.stride,
                                        padding=pred_conv_layer_old.padding,
                                        bias=True
                                        )
        model.module_list[pred_conv_sequential_idx] = nn.Sequential(new_pred_conv_layer)
        anchors_for_new_layer = yolo_layer_old_instance.anchors.tolist()
        stride_for_new_layer = yolo_layer_old_instance.stride
        new_yolo_layer = YOLOLayer(anchors_for_new_layer, NUM_CLASSES_YOUR_DATASET, new_coords=False)
        model.module_list[i] = nn.Sequential(new_yolo_layer)
        model.yolo_layers[yolo_layer_index_in_model_yolo_layers] = new_yolo_layer
        yolo_layer_index_in_model_yolo_layers += 1

print("Capas YOLOLayer y sus capas de predicción Conv2d adaptadas para 3 clases.")

# --- NUEVA SECCIÓN: CONGELAR TODAS LAS CAPAS, SOLO DESCONGELAR LAS ULTIMAS Conv2d DE PREDICCIÓN ---
print("\nConfigurando capas para Fine-Tuning (solo las capas Conv2d justo antes de cada YOLOLayer serán entrenables):")

# Congelar todos los parámetros por defecto
for param in model.parameters():
    param.requires_grad = False

# Solo las Conv2d antes de YOLOLayer quedan como entrenables
for i, module_def in enumerate(model.module_defs):
    if module_def["type"] == "yolo":
        pred_conv_sequential_idx = i - 1
        conv_seq = model.module_list[pred_conv_sequential_idx]
        # Buscar la capa Conv2d dentro del Sequential
        for layer in conv_seq:
            if isinstance(layer, nn.Conv2d):
                for param in layer.parameters():
                    param.requires_grad = True
                print(f"  Descongelada capa Conv2d antes del YOLOLayer en module_list[{i}]")

# --- Verificación de Capas Entrenables ---
print("\nVerificación de capas que se entrenarán ('requires_grad=True'):")
trainable_params_count = 0
for name, param in model.named_parameters():
    if param.requires_grad:
        print(name)
        trainable_params_count += param.numel()

total_params = sum(p.numel() for p in model.parameters())
print(f"\nTotal de parámetros entrenables: {trainable_params_count / 1e6:.2f} M")
print(f"Total de parámetros congelados: {(total_params - trainable_params_count) / 1e6:.2f} M")
print(f"Total de parámetros en el modelo: {total_params / 1e6:.2f} M")

# PASO 5: Prueba Final de la Pasada hacia Adelante (sanity check)
print("\nRealizando una pasada hacia adelante para verificar la configuración del modelo...")

model.eval()
dummy_input = torch.randn(1, 3, IMG_SIZE, IMG_SIZE).to(device)
with torch.no_grad():
    predictions = model(dummy_input)

print(f"\nShape de la salida del modelo después de cargar pesos y adaptar a {NUM_CLASSES_YOUR_DATASET} clases (en modo EVAL):")
print(f"  Escala 13x13: {predictions[0].shape} (Esperado: [N, 3*13*13, 5+C])")
print(f"  Escala 26x26: {predictions[1].shape} (Esperado: [N, 3*26*26, 5+C])")
print(f"  Escala 52x52: {predictions[2].shape} (Esperado: [N, 3*52*52, 5+C])")
print(f"¡Las dimensiones de salida para {NUM_CLASSES_YOUR_DATASET} clases son correctas en modo EVAL!\n")
print("\n--- ¡Fase de Configuración del Modelo YOLOv3 Completada Exitosamente! ---")


Trabajando en el dispositivo: cpu
Cargando la arquitectura del modelo desde: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/config/yolov3.cfg (con classes=80)
Modelo YOLOv3 cargado correctamente en el dispositivo:  cpu
Intentando cargar pesos pre-entrenados desde: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/yolov3.weights
Pesos pre-entrenados cargados con éxito.

Adaptando las capas de predicción a 3 clases...
Capas YOLOLayer y sus capas de predicción Conv2d adaptadas para 3 clases.

Configurando capas para Fine-Tuning (solo las capas Conv2d justo antes de cada YOLOLayer serán entrenables):
  Descongelada capa Conv2d antes del YOLOLayer en module_list[82]
  Descongelada capa Conv2d antes del YOLOLayer en module_list[94]
  Descongelada capa Conv2d antes del YOLOLayer en module_list[106]

Verificación de capas que se entrenarán ('requires_grad=True'):
module_list.81.0.weight
module_list.81.0.bias
module_list.93.0.weight
module_list.93.0.bias
module_list.105.0.w

In [6]:
# PASO 1: Definición de la clase BloodCellDataset
# Esta clase debe manejar la carga de imágenes y anotaciones, así como las transformaciones necesarias.
# Modificada para que filtre las bounding boxes degeneradas o inválidas.

class BloodCellDataset(Dataset):
    def __init__(self, data_root, annotations_df, image_size=(416, 416), transform=None):
        self.data_root = data_root
        self.image_folder = os.path.join(data_root, 'BCCD')
        self.image_size = image_size
        self.transform = transform
        
        self.class_name_to_id = {
            'RBC': 0, 'WBC': 1, 'Platelets': 2
        }
        self.class_id_to_name = {
            0: 'RBC', 1: 'WBC', 2: 'Platelets'
        }
        
        self.image_annotations = {}
        # Filtrar el DataFrame de anotaciones para eliminar filas con valores NaN en columnas clave
        annotations_df = annotations_df.dropna(subset=['filename', 'xmin', 'ymin', 'xmax', 'ymax', 'cell_type'])
        
        for filename, group in annotations_df.groupby('filename'):
            bboxes_pixel_list = []
            for idx, row in group.iterrows():
                cell_type = str(row['cell_type']) # Asegurarse de que sea string
                xmin = int(row['xmin'])
                xmax = int(row['xmax'])
                ymin = int(row['ymin'])
                ymax = int(row['ymax']) 
                
                class_id = self.class_name_to_id.get(cell_type)
                if class_id is None:
                    print(f"Advertencia: Tipo de célula desconocido '{cell_type}' en el archivo {filename}. Saltando anotación.")
                    continue

                # Asegurarse de que xmin < xmax y ymin < ymax antes de guardar
                if xmin >= xmax or ymin >= ymax:
                    # print(f"Advertencia: Bounding box degenerado o inválido en {filename}: ({xmin}, {ymin}, {xmax}, {ymax}). Saltando.")
                    continue # Saltar esta bbox inválida

                bboxes_pixel_list.append([xmin, ymin, xmax, ymax, class_id])
            
            # Solo añadir la imagen si tiene al menos una bbox válida
            if bboxes_pixel_list:
                self.image_annotations[filename] = bboxes_pixel_list
        
        self.image_files = list(self.image_annotations.keys())
        print(f"Dataset inicializado con {len(self.image_files)} imágenes.")
        
    def __len__(self):
        return len(self.image_files)

    def __getitem__(self, idx):
        try:
            img_name = self.image_files[idx]
            img_path = os.path.join(self.image_folder, img_name)
        
            image = cv2.imread(img_path)
            if image is None:
                raise FileNotFoundError(f"No se pudo cargar la imagen: {img_path}")
            image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

            original_h, original_w, _ = image.shape
            #print(f"DEBUG: Imagen original (H, W): ({original_h}, {original_w})")

            bboxes_pixel = self.image_annotations.get(img_name, [])
            #print(f"DEBUG: __getitem__ para {img_name}. Bboxes iniciales (píxeles): {len(bboxes_pixel)}")
            #if bboxes_pixel:
            #    print(f"DEBUG: Primer bbox pixel: {bboxes_pixel[0]}")
        
            # --- NORMALIZAR BBOXES A [0, 1] ANTES DE ALBUMENTATIONS ---
            # Albumentations espera bboxes normalizadas si format='albumentations'
            bboxes_normalized_initial = []
            class_labels = [] # class_labels se mantiene
            for bbox_px in bboxes_pixel:
                xmin_px, ymin_px, xmax_px, ymax_px, class_id = bbox_px
            
                # Normalizar las coordenadas a [0, 1] usando las dimensiones originales
                xmin_norm = xmin_px / original_w
                ymin_norm = ymin_px / original_h
                xmax_norm = xmax_px / original_w
                ymax_norm = ymax_px / original_h
            
                bboxes_normalized_initial.append([xmin_norm, ymin_norm, xmax_norm, ymax_norm])
                class_labels.append(class_id)
        
            #print(f"DEBUG: Bboxes normalizadas (iniciales): {len(bboxes_normalized_initial)}")
            #if bboxes_normalized_initial:
            #    print(f"DEBUG: Primer bbox normalizada (inicial): {bboxes_normalized_initial[0]}, clase: {class_labels[0]}")

            if self.transform:
                # Albumentations ahora recibe coordenadas normalizadas y las transformará.
                # Se espera que devuelva coordenadas normalizadas también.
                transformed = self.transform(image=image, bboxes=bboxes_normalized_initial, class_labels=class_labels)
                image = transformed['image']
                bboxes_transformed_raw = transformed['bboxes'] # Bboxes después de Albumentations (deberían estar normalizadas)
                class_labels = transformed['class_labels'] # Las etiquetas de clase se mantienen
            
            #print(f"DEBUG: Bboxes después de Albumentations (raw, deberían estar normalizadas): {len(bboxes_transformed_raw)}")
            #if bboxes_transformed_raw:
            #    print(f"DEBUG: Primer bbox después de Albumentations (raw, deberían estar normalizadas): {bboxes_transformed_raw[0]}")

            # --- ELIMINAR PASO DE RE-NORMALIZACIÓN HEURÍSTICA ---
            # Si Albumentations funciona como se espera con format='albumentations',
            # este paso ya no es necesario.
            bboxes = bboxes_transformed_raw # Usar las bboxes directamente de Albumentations
        
            #print(f"DEBUG: Bboxes finales antes de YOLO format: {len(bboxes)}")
            #if bboxes:
            #    print(f"DEBUG: Primer bbox final antes de YOLO format: {bboxes[0]}")
            # --- FIN ELIMINAR PASO ---


            # Si ToTensorV2 ya se aplicó, la imagen es un tensor. Si no, convertirla.
            if not isinstance(image, torch.Tensor):
                image = torch.from_numpy(image).permute(2, 0, 1).float() / 255.0

            yolo_bboxes = []
            for i, bbox in enumerate(bboxes):
                x_min, y_min, x_max, y_max = bbox
            
                # Asegurar que las coordenadas estén dentro de [0, 1]
                x_min = max(0.0, min(1.0, x_min))
                y_min = max(0.0, min(1.0, y_min))
                x_max = max(0.0, min(1.0, x_max))
                y_max = max(0.0, min(1.0, y_max))

                center_x = (x_min + x_max) / 2
                width = x_max - x_min
                center_y = (y_min + y_max) / 2
                height = y_max - y_min
            
                # Este filtrado ya estaba, pero el error ocurría antes
                if width <= 0 or height <= 0:
                    print(f"DEBUG: Bbox filtrada por width/height <= 0: {bbox}")
                    continue # Saltar esta bbox inválida después de transformación

                yolo_bboxes.append([class_labels[i], center_x, center_y, width, height])
            
            #print(f"DEBUG: Bboxes finales en formato YOLO: {len(yolo_bboxes)}")
            #if yolo_bboxes:
            #    print(f"DEBUG: Primer bbox YOLO: {yolo_bboxes[0]}")

            if len(yolo_bboxes) == 0:
                # Devuelve un tensor vacío si no hay bboxes válidas
                yolo_bboxes = torch.zeros((0, 5), dtype=torch.float32)
            else:
                yolo_bboxes = torch.tensor(yolo_bboxes, dtype=torch.float32)
        
            return image, yolo_bboxes
        
        except Exception as e:
            print(f"Error en __getitem__ para idx {idx}: {e}")
            return torch.zeros((3, *self.image_size)), torch.zeros((0, 5))
        
print("Clase BloodCellDataset definida correctamente.")
        


Clase BloodCellDataset definida correctamente.


In [7]:
# PASO 2: Definición de las transformaciones de Albumentations
# Define el tamaño de entrada de tu modelo YOLOv3 (416x416)

YOLO_INPUT_SIZE = (416, 416) 

# --- TRANSFORMACIONES DE ENTRENAMIENTO CON AUMENTACIÓN DE COLOR/APARIENCIA ---
train_transforms = A.Compose([
    # Redimensionamiento y Relleno
    A.LongestMaxSize(max_size=YOLO_INPUT_SIZE[0], p=1.0), 
    A.PadIfNeeded(min_height=YOLO_INPUT_SIZE[0], min_width=YOLO_INPUT_SIZE[1], border_mode=cv2.BORDER_CONSTANT, value=0, p=1.0),
    
    # Transformaciones de Color y Apariencia
    A.RGBShift(r_shift_limit=10, g_shift_limit=10, b_shift_limit=10, p=0.5),
    A.RandomBrightnessContrast(brightness_limit=0.2, contrast_limit=0.2, p=0.5),
    A.GaussNoise(p=0.2),
    A.Blur(blur_limit=3, p=0.1), # Asegúrate de que blur_limit es impar y no demasiado grande
    
    # Normalización y Conversión a Tensor
    A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)), 
    ToTensorV2(), 
], bbox_params=A.BboxParams(format='albumentations', label_fields=['class_labels'])) # El formato 'albumentations' espera y devuelve normalizado [0,1]

# Las transformaciones de validación/prueba se mantienen minimalistas
val_test_transforms = A.Compose([
    A.LongestMaxSize(max_size=YOLO_INPUT_SIZE[0], p=1.0), 
    A.PadIfNeeded(min_height=YOLO_INPUT_SIZE[0], min_width=YOLO_INPUT_SIZE[1], border_mode=cv2.BORDER_CONSTANT, value=0, p=1.0),
    A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)),
    ToTensorV2(),
], bbox_params=A.BboxParams(format='albumentations', label_fields=['class_labels'])) 

print("Transformaciones de Albumentations definidas correctamente.")


Transformaciones de Albumentations definidas correctamente.


In [8]:
# PASO 3: Definición de la función Collate_fn para el DataLoader
def collate_fn(batch):
    images = []
    bboxes = []
    for img, bbox_target in batch:
        images.append(img)
        bboxes.append(bbox_target) 
    images = torch.stack(images, 0)
    return images, bboxes

print("Función collate_fn definida correctamente.")

Función collate_fn definida correctamente.


In [9]:

# PASO 4: Definición de la Lógica de División del Dataset y Creación de DataLoaders
# Modificada para que visualice las imágenes con las bounding boxes

# RUTAS A LOS DATOS
DATA_ROOT = 'C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/dataset'
CSV_FILE = os.path.join(DATA_ROOT, 'annotations.csv') 
        
# Parámetros de la división
TEST_SPLIT_RATIO = 0.15    
VAL_SPLIT_RATIO = 0.15     
RANDOM_SEED = SEED           
BATCH_SIZE = 8
NUM_WORKERS = 0 # Deja en 0 para depuración, luego puedes aumentarlo a 4-8

# --- Cargar todas las anotaciones y obtener nombres de archivo únicos ---
print(f"Cargando todas las anotaciones desde: {CSV_FILE}")
full_df = pd.read_csv(CSV_FILE)
    
# Obtener la lista de nombres de archivo únicos presentes en el CSV
all_image_filenames = full_df['filename'].unique().tolist()
print(f"Total de {len(all_image_filenames)} imágenes únicas encontradas en el CSV.")

# --- Dividir los nombres de archivo en entrenamiento y test ---
train_val_filenames, test_filenames = train_test_split(
    all_image_filenames, 
    test_size=TEST_SPLIT_RATIO, 
    random_state=RANDOM_SEED
)
    
train_filenames, val_filenames = train_test_split(
    train_val_filenames, 
    test_size=VAL_SPLIT_RATIO / (1 - TEST_SPLIT_RATIO), 
    random_state=RANDOM_SEED
)

print(f"Imágenes para entrenamiento: {len(train_filenames)}")
print(f"Imágenes para validación: {len(val_filenames)}")
print(f"Imágenes para prueba: {len(test_filenames)}")

# --- Crear DataFrames de anotaciones para cada split ---
train_df = full_df[full_df['filename'].isin(train_filenames)].copy()
val_df = full_df[full_df['filename'].isin(val_filenames)].copy()
test_df = full_df[full_df['filename'].isin(test_filenames)].copy()

# --- Crear instancias del Dataset y DataLoader para cada split ---
train_dataset = BloodCellDataset(
    data_root=DATA_ROOT,
    annotations_df=train_df, 
    image_size=YOLO_INPUT_SIZE,
    transform=train_transforms
)
val_dataset = BloodCellDataset(
    data_root=DATA_ROOT,
    annotations_df=val_df, 
    image_size=YOLO_INPUT_SIZE,
    transform=val_test_transforms 
)
test_dataset = BloodCellDataset(
    data_root=DATA_ROOT,
    annotations_df=test_df, 
    image_size=YOLO_INPUT_SIZE,
    transform=val_test_transforms 
)

PIN_MEMORY = torch.cuda.is_available()  # Solo True si hay GPU
train_loader = DataLoader(
    train_dataset, batch_size=BATCH_SIZE, shuffle=True,
    num_workers=NUM_WORKERS, collate_fn=collate_fn, pin_memory=PIN_MEMORY
)
    
val_loader = DataLoader(
    val_dataset, batch_size=BATCH_SIZE, shuffle=False,
    num_workers=NUM_WORKERS, collate_fn=collate_fn, pin_memory=PIN_MEMORY
)

test_loader = DataLoader(
    test_dataset, batch_size=BATCH_SIZE, shuffle=False,
    num_workers=NUM_WORKERS, collate_fn=collate_fn, pin_memory=PIN_MEMORY
)

print("\nDataset y DataLoaders de entrenamiento, validación y prueba configurados exitosamente.")

# --- Verificación de la carga de un lote de entrenamiento ---
print("\nVerificando la carga de un lote de entrenamiento...")
MAX_BATCHES_TO_CHECK = 10 
found_image_with_boxes = False

for batch_idx, (images, targets) in enumerate(train_loader):
    print(f"Tamaño del lote {batch_idx+1}: Imágenes: {images.shape}, Targets: {len(targets)}")
        
    # Buscar una imagen con cajas en el lote actual
    for img_idx in range(len(targets)):
        if targets[img_idx].numel() > 0: 
            print(f"--- Encontrada imagen con {targets[img_idx].shape[0]} cajas en el lote {batch_idx+1}, imagen {img_idx+1} ---")
            print(f"Ejemplo de target para esta imagen (clase, cx, cy, w, h normalizados):")
            print(targets[img_idx][0])
                
            # --- Lógica de visualización ---
            mean = torch.tensor((0.485, 0.456, 0.406)).view(3, 1, 1).to(images[img_idx].device)
            std = torch.tensor((0.229, 0.224, 0.225)).view(3, 1, 1).to(images[img_idx].device)
                
            img_display_rgb = (images[img_idx] * std + mean) * 255
            img_display_rgb = img_display_rgb.permute(1, 2, 0).cpu().numpy().astype(np.uint8)
            img_display_bgr = cv2.cvtColor(img_display_rgb, cv2.COLOR_RGB2BGR)
                
            img_h, img_w = img_display_bgr.shape[:2]
                
            CLASS_ID_TO_NAME_MAP = {0: 'RBC', 1: 'WBC', 2: 'Platelets'}
            CLASS_COLORS_MAP = {0: (0, 0, 255), 1: (0, 255, 0), 2: (255, 0, 0)} # BGR

            print("\nVisualizando la imagen con GT Boxes (presiona cualquier tecla para cerrar)...")
            for bbox_yolo in targets[img_idx].tolist():
                class_id, cx, cy, w, h = bbox_yolo
                    
                x_min_norm = cx - w/2
                y_min_norm = cy - h/2
                x_max_norm = cx + w/2
                y_max_norm = cy + h/2

                x_min_px = int(x_min_norm * img_w)
                y_min_px = int(y_min_norm * img_h)
                x_max_px = int(x_max_norm * img_w)
                y_max_px = int(y_max_norm * img_h)

                color = CLASS_COLORS_MAP.get(int(class_id), (255, 255, 255)) 
                cv2.rectangle(img_display_bgr, (x_min_px, y_min_px), (x_max_px, y_max_px), color, 2)

                label_text = f"{CLASS_ID_TO_NAME_MAP.get(int(class_id), 'Unknown')}"
                text_size = cv2.getTextSize(label_text, cv2.FONT_HERSHEY_SIMPLEX, 0.5, 1)[0]
                text_x = x_min_px
                text_y = y_min_px - 5 if y_min_px - 5 > 5 else y_min_px + text_size[1] + 5
                    
                cv2.rectangle(img_display_bgr, (text_x, text_y - text_size[1] - 5), 
                            (text_x + text_size[0] + 5, text_y + 5), color, -1)
                cv2.putText(img_display_bgr, label_text, (text_x, text_y), 
                            cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 1, cv2.LINE_AA)

            cv2.imshow("Imagen con GT Boxes", img_display_bgr)
            cv2.waitKey(0) 
            cv2.destroyAllWindows()
                
            found_image_with_boxes = True
            break 
        
    if found_image_with_boxes or batch_idx + 1 >= MAX_BATCHES_TO_CHECK:
        break 

if not found_image_with_boxes:
    print(f"\nNo se encontró ninguna imagen con bounding boxes en los primeros {MAX_BATCHES_TO_CHECK} lotes.")
    print("Esto podría deberse a que todas las imágenes mostradas no tenían bboxes o fueron filtradas.")
    print("Considera revisar:")
    print("1. El contenido de 'annotations.csv' para asegurar que hay bboxes válidas.")
    print("2. Los filtros en BloodCellDataset (xmin >= xmax, etc.).")
    print("3. Los parámetros de bbox en Albumentations (min_area, min_visibility).")
    print("4. Si RandomCrop está eliminando demasiadas bboxes si son pequeñas o están en los bordes.")

Cargando todas las anotaciones desde: C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/dataset\annotations.csv
Total de 364 imágenes únicas encontradas en el CSV.
Imágenes para entrenamiento: 254
Imágenes para validación: 55
Imágenes para prueba: 55
Dataset inicializado con 254 imágenes.
Dataset inicializado con 55 imágenes.
Dataset inicializado con 55 imágenes.

Dataset y DataLoaders de entrenamiento, validación y prueba configurados exitosamente.

Verificando la carga de un lote de entrenamiento...
Tamaño del lote 1: Imágenes: torch.Size([8, 3, 416, 416]), Targets: 8
--- Encontrada imagen con 13 cajas en el lote 1, imagen 1 ---
Ejemplo de target para esta imagen (clase, cx, cy, w, h normalizados):
tensor([0.0000, 0.8117, 0.5219, 0.2109, 0.1688])

Visualizando la imagen con GT Boxes (presiona cualquier tecla para cerrar)...


In [10]:
# IOU

def intersection_over_union(boxes_preds, boxes_labels, box_format="midpoint"):
    if box_format == "midpoint":
        box1_x1 = boxes_preds[..., 0:1] - boxes_preds[..., 2:3] / 2
        box1_y1 = boxes_preds[..., 1:2] - boxes_preds[..., 3:4] / 2
        box1_x2 = boxes_preds[..., 0:1] + boxes_preds[..., 2:3] / 2
        box1_y2 = boxes_preds[..., 1:2] + boxes_preds[..., 3:4] / 2

        box2_x1 = boxes_labels[..., 0:1] - boxes_labels[..., 2:3] / 2
        box2_y1 = boxes_labels[..., 1:2] - boxes_labels[..., 3:4] / 2
        box2_x2 = boxes_labels[..., 0:1] + boxes_labels[..., 2:3] / 2
        box2_y2 = boxes_labels[..., 1:2] + boxes_labels[..., 3:4] / 2

    elif box_format == "corners":
        box1_x1 = boxes_preds[..., 0:1]
        box1_y1 = boxes_preds[..., 1:2]
        box1_x2 = boxes_preds[..., 2:3]
        box1_y2 = boxes_preds[..., 3:4]

        box2_x1 = boxes_labels[..., 0:1]
        box2_y1 = boxes_labels[..., 1:2]
        box2_x2 = boxes_labels[..., 2:3]
        box2_y2 = boxes_labels[..., 3:4]
    else:
        raise ValueError("box_format debe ser 'midpoint' o 'corners'")

    x1_inter = torch.max(box1_x1, box2_x1)
    y1_inter = torch.max(box1_y1, box2_y1)
    x2_inter = torch.min(box1_x2, box2_x2)
    y2_inter = torch.min(box1_y2, box2_y2)

    intersection = (x2_inter - x1_inter).clamp(0) * (y2_inter - y1_inter).clamp(0)
    box1_area = abs((box1_x2 - box1_x1) * (box1_y2 - box1_y1))
    box2_area = abs((box2_x2 - box2_x1) * (box2_y2 - box2_y1))
    union = box1_area + box2_area - intersection + 1e-6
    iou = intersection / union
    return iou

print("\nFunción de Intersection over Union (IoU) definida correctamente.")


Función de Intersection over Union (IoU) definida correctamente.


In [11]:
# Funcion de Perdida de YOLOV3

class YOLOv3Loss(nn.Module):
    def __init__(self, anchors, num_classes, img_size=(416, 416),
                lambda_coord=1.0, lambda_noobj=1.0, lambda_obj=1.0, lambda_class=1.0,
                ignore_iou_threshold=0.5, device=None):
        super().__init__()
        self.anchors = anchors
        self.num_classes = num_classes
        self.img_size = img_size
        self.lambda_coord = lambda_coord
        self.lambda_noobj = lambda_noobj
        self.lambda_obj = lambda_obj
        self.lambda_class = lambda_class
        self.ignore_iou_threshold = ignore_iou_threshold

        self.mse = nn.MSELoss()
        self.bce = nn.BCEWithLogitsLoss(pos_weight=torch.tensor([1.0]))
        self.device = device if device is not None else torch.device('cuda' if torch.cuda.is_available() else 'cpu')

    def forward(self, predictions, targets):
        obj_loss = 0
        noobj_loss = 0
        box_loss = 0
        class_loss = 0

        # Convert anchors to tensor only once, on correct device
        anchors_tensor = [torch.tensor(a, dtype=torch.float32, device=self.device) for a in self.anchors]

        for scale_idx, prediction in enumerate(predictions):
            #print(f"DEBUG: Shape prediction[{scale_idx}]: {prediction.shape}")
            #if prediction.dim() != 4:
            #    print(f"WARNING: prediction[{scale_idx}] tiene {prediction.dim()} dimensiones: {prediction.shape}")
            #continue  # o lanza una excepción explicativa
            # ... sigue con permute y reshape ...
            # prediction: (N, 3*(5+C), H, W)
            prediction = prediction.permute(0, 2, 3, 1).reshape(
                prediction.shape[0], prediction.shape[2], prediction.shape[3], 3, self.num_classes + 5
            )

            pred_x_y = prediction[..., 0:2]
            pred_w_h = prediction[..., 2:4]
            pred_obj = prediction[..., 4:5]
            pred_class = prediction[..., 5:]

            N, grid_h, grid_w, num_anchors, _ = prediction.shape

            anchors_current_scale = anchors_tensor[scale_idx].reshape(1, 1, 1, num_anchors, 2)

            # Inicializar todo en el device correcto
            target_obj_mask = torch.zeros((N, grid_h, grid_w, num_anchors), dtype=torch.float32, device=self.device)
            target_noobj_mask = torch.ones((N, grid_h, grid_w, num_anchors), dtype=torch.float32, device=self.device)
            tx = torch.zeros((N, grid_h, grid_w, num_anchors), device=self.device)
            ty = torch.zeros((N, grid_h, grid_w, num_anchors), device=self.device)
            tw = torch.zeros((N, grid_h, grid_w, num_anchors), device=self.device)
            th = torch.zeros((N, grid_h, grid_w, num_anchors), device=self.device)
            target_class_one_hot = torch.zeros((N, grid_h, grid_w, num_anchors, self.num_classes), dtype=torch.float32, device=self.device)

            # Vectorizar asignación de anchors
            if targets.numel() > 0:
                # targets: (num_true_boxes_in_batch, 6)
                img_ids = targets[:, 0].long()
                class_ids = targets[:, 1].long()
                x_gt_norm = targets[:, 2]
                y_gt_norm = targets[:, 3]
                w_gt_norm = targets[:, 4]
                h_gt_norm = targets[:, 5]

                x_center_grid = x_gt_norm * grid_w
                y_center_grid = y_gt_norm * grid_h
                cell_x = x_center_grid.long()
                cell_y = y_center_grid.long()

                # Filtrar targets fuera de grid
                grid_mask = (cell_x >= 0) & (cell_x < grid_w) & (cell_y >= 0) & (cell_y < grid_h) & (img_ids >= 0) & (img_ids < N)
                img_ids = img_ids[grid_mask]
                class_ids = class_ids[grid_mask]
                cell_x = cell_x[grid_mask]
                cell_y = cell_y[grid_mask]
                x_center_grid = x_center_grid[grid_mask]
                y_center_grid = y_center_grid[grid_mask]
                w_gt_norm = w_gt_norm[grid_mask]
                h_gt_norm = h_gt_norm[grid_mask]

                # Anchors assignment (vectorized)
                w_gt_pix = w_gt_norm * self.img_size[0]
                h_gt_pix = h_gt_norm * self.img_size[1]
                gt_box_dims = torch.stack([
                    torch.zeros_like(w_gt_pix), torch.zeros_like(h_gt_pix), w_gt_pix, h_gt_pix
                ], dim=1)  # (num_boxes, 4)

                anchor_boxes_for_iou = torch.zeros((num_anchors, 4), device=self.device)
                anchor_boxes_for_iou[:, 2] = anchors_current_scale[0,0,0,:,0]
                anchor_boxes_for_iou[:, 3] = anchors_current_scale[0,0,0,:,1]

                # Expand gt_box_dims for broadcasting
                gt_box_dims_exp = gt_box_dims.unsqueeze(1).expand(-1, num_anchors, 4)  # (num_boxes, num_anchors, 4)
                anchors_exp = anchor_boxes_for_iou.unsqueeze(0).expand(gt_box_dims.size(0), -1, 4)  # (num_boxes, num_anchors, 4)

                ious = intersection_over_union(gt_box_dims_exp, anchors_exp, box_format="corners").squeeze(-1)  # (num_boxes, num_anchors)
                best_iou_anchor_idx = torch.argmax(ious, dim=1)  # (num_boxes,)

                for idx in range(img_ids.shape[0]):
                    i = img_ids[idx]
                    c = class_ids[idx]
                    cx = cell_x[idx]
                    cy = cell_y[idx]
                    best_anchor = best_iou_anchor_idx[idx]
                    # Masks
                    target_obj_mask[i, cy, cx, best_anchor] = 1.0
                    target_noobj_mask[i, cy, cx, best_anchor] = 0.0
                    # Coordinates
                    tx[i, cy, cx, best_anchor] = x_center_grid[idx] - cx
                    ty[i, cy, cx, best_anchor] = y_center_grid[idx] - cy
                    tw[i, cy, cx, best_anchor] = torch.log(w_gt_pix[idx] / anchors_current_scale[0,0,0,best_anchor,0] + 1e-16)
                    th[i, cy, cx, best_anchor] = torch.log(h_gt_pix[idx] / anchors_current_scale[0,0,0,best_anchor,1] + 1e-16)
                    # Class
                    target_class_one_hot[i, cy, cx, best_anchor, c] = 1.0
                    # Ignore anchors with high IoU
                    for anchor_idx_other in range(num_anchors):
                        if anchor_idx_other == best_anchor:
                            continue
                        if ious[idx, anchor_idx_other] > self.ignore_iou_threshold:
                            target_noobj_mask[i, cy, cx, anchor_idx_other] = 0.0

            loss_x = self.bce(pred_x_y[..., 0][target_obj_mask.bool()], tx[target_obj_mask.bool()])
            loss_y = self.bce(pred_x_y[..., 1][target_obj_mask.bool()], ty[target_obj_mask.bool()])
            loss_w = self.mse(pred_w_h[..., 0][target_obj_mask.bool()], tw[target_obj_mask.bool()])
            loss_h = self.mse(pred_w_h[..., 1][target_obj_mask.bool()], th[target_obj_mask.bool()])
            box_loss += (loss_x + loss_y + loss_w + loss_h)

            loss_obj = self.bce(pred_obj[target_obj_mask.bool()], target_obj_mask[target_obj_mask.bool()].float().unsqueeze(-1))
            loss_noobj = self.bce(pred_obj[target_noobj_mask.bool()], target_noobj_mask[target_noobj_mask.bool()].float().unsqueeze(-1))
            obj_loss += loss_obj
            noobj_loss += loss_noobj

            loss_class = self.bce(pred_class[target_obj_mask.bool()], target_class_one_hot[target_obj_mask.bool()])
            class_loss += loss_class

        total_loss = (
            self.lambda_coord * box_loss
            + self.lambda_obj * obj_loss
            + self.lambda_noobj * noobj_loss
            + self.lambda_class * class_loss
        )
        return total_loss, {"box_loss": box_loss, "obj_loss": obj_loss, "noobj_loss": noobj_loss, "class_loss": class_loss}

print("Clase YOLOv3Loss definida correctamente.")

Clase YOLOv3Loss definida correctamente.


In [12]:
# Adaptación de las predicciones para la función de pérdida
# Esta función adapta las predicciones del modelo para que coincidan con el formato esperado por la función de pérdida.

def adapt_predictions_for_loss(predictions, num_classes):
    adapted = []
    for idx, p in enumerate(predictions):
        if p.dim() != 5:
            print(f"WARNING: predictions[{idx}] tiene {p.dim()} dimensiones y shape {p.shape} (esperado: 5D). Se ignora este tensor.")
            continue  # salta este tensor
        B, A, H, W, C = p.shape  # C=5+num_classes
        p = p.permute(0, 1, 4, 2, 3).contiguous()  # [B, A, 5+C, H, W]
        p = p.view(B, -1, H, W)  # [B, A*(5+C), H, W]
        adapted.append(p)
    return adapted

print("Función adapt_predictions_for_loss definida correctamente.")

Función adapt_predictions_for_loss definida correctamente.


In [13]:
# Entrenamiento del modelo YOLO Version 3

# PASO 1: Anchors personalizados
print(f"Anchors: {ANCHORS}")
print("Anchors personalizados definidos correctamente.")
print()

# PASO2: Paths y parámetros
DATA_ROOT = 'C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/dataset'
CSV_FILE = os.path.join(DATA_ROOT, 'annotations.csv')
BATCH_SIZE = 4
NUM_WORKERS = 0  # Ajusta según tu máquina
NUM_CLASSES = 3
IMG_SIZE = YOLO_INPUT_SIZE
EPOCHS = 50
LR = 1e-4
WEIGHT_DECAY = 1e-4

# PASO 3: Comprobar dataset y dataloaders
print(f"Comprobando dataset y dataloaders en {DATA_ROOT}...")

print(train_df.head())
print(f"Total de imágenes no diferentes de entrenamiento: {len(train_df)}")

print(val_df.head())
print(f"Total de imágenes no diferentes de validación: {len(val_df)}")
print(test_df.head())
print(f"Total de imágenes no diferentes  de prueba: {len(test_df)}")

# PASO 4: Pérdida y optimizador

loss_fn = YOLOv3Loss(
    anchors=ANCHORS,
    num_classes=NUM_CLASSES,
    img_size=IMG_SIZE,
    lambda_coord=1.0,
    lambda_noobj=1.0,
    lambda_obj=1.0,
    lambda_class=1.0,
    ignore_iou_threshold=0.5,
    device=device
).to(device)

# Solo parámetros entrenables (solo los heads)
optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=LR, weight_decay=WEIGHT_DECAY)
print()
print("Función de pérdida y optimizador definidos correctamente.")

Anchors: [[(227, 210), (179, 155), (124, 111)], [(105, 113), (104, 96), (80, 109)], [(112, 75), (87, 82), (39, 38)]]
Anchors personalizados definidos correctamente.

Comprobando dataset y dataloaders en C:/Users/gtoma/Master_AI_Aplicada/GitHubRep/PyTorch-YOLOv3/dataset...
               filename cell_type  xmin  xmax  ymin  ymax
0  BloodImage_00000.jpg       WBC   260   491   177   376
1  BloodImage_00000.jpg       RBC    78   184   336   435
2  BloodImage_00000.jpg       RBC    63   169   237   336
3  BloodImage_00000.jpg       RBC   214   320   362   461
4  BloodImage_00000.jpg       RBC   414   506   352   445
Total de imágenes no diferentes de entrenamiento: 3435
                 filename cell_type  xmin  xmax  ymin  ymax
163  BloodImage_00009.jpg       WBC    23   255   137   423
164  BloodImage_00009.jpg       RBC   441   575   324   423
165  BloodImage_00009.jpg       RBC   372   468   192   279
166  BloodImage_00009.jpg       RBC   305   401   213   300
167  BloodImage_00009.jp

In [14]:
# Entrenamiento del modelo YOLO Version 3

# PASO 5: Funciones del Training Loop
def train_one_epoch(model, loader, loss_fn, optimizer, device):
    model.train()
    running_loss, box_loss, obj_loss, noobj_loss, class_loss = 0.0, 0.0, 0.0, 0.0, 0.0
    for images, targets in tqdm(loader, desc="Entrenando"):
        if images.shape[0] == 0:
            print("Batch vacío saltado (entrenamiento)")
            continue  # Salta este batch vacío
        images = images.to(device)
        all_targets = []
        for batch_idx, t in enumerate(targets):
            if t.numel() > 0:
                img_idx_col = torch.full((t.shape[0], 1), batch_idx, dtype=torch.float32, device=device)
                all_targets.append(torch.cat([img_idx_col, t.to(device)], dim=1))
        if len(all_targets) > 0:
            all_targets = torch.cat(all_targets, dim=0)
        else:
            all_targets = torch.zeros((0, 6), dtype=torch.float32, device=device)
        optimizer.zero_grad()
        if all_targets.numel() == 0:
            print("Batch de imágenes sin ningún target: saltado.")
            continue
        predictions = model(images)
        #print([p.shape for p in predictions])
        predictions = adapt_predictions_for_loss(predictions, num_classes=NUM_CLASSES)
        loss, components = loss_fn(predictions, all_targets)
        loss.backward()
        optimizer.step()
        #running_loss += loss.item()
        #box_loss += components['box_loss'].item()
        #obj_loss += components['obj_loss'].item()
        #noobj_loss += components['noobj_loss'].item()
        #class_loss += components['class_loss'].item()
        running_loss += float(loss)
        box_loss += float(components['box_loss'])
        obj_loss += float(components['obj_loss'])
        noobj_loss += float(components['noobj_loss'])
        class_loss += float(components['class_loss'])
    n = len(loader)
    if n == 0:
        return 0, 0, 0, 0, 0
    return (running_loss/n, box_loss/n, obj_loss/n, noobj_loss/n, class_loss/n)

@torch.no_grad()
def validate_one_epoch(model, loader, loss_fn, device):
    model.eval()
    running_loss, box_loss, obj_loss, noobj_loss, class_loss = 0.0, 0.0, 0.0, 0.0, 0.0
    for images, targets in tqdm(loader, desc="Validando"):
        if images.shape[0] == 0:
            print("Batch vacío saltado (validacion)")
            continue  # Salta este batch vacío
        images = images.to(device)
        all_targets = []
        for batch_idx, t in enumerate(targets):
            if t.numel() > 0:
                img_idx_col = torch.full((t.shape[0], 1), batch_idx, dtype=torch.float32, device=device)
                all_targets.append(torch.cat([img_idx_col, t.to(device)], dim=1))
        if len(all_targets) > 0:
            all_targets = torch.cat(all_targets, dim=0)
        else:
            all_targets = torch.zeros((0, 6), dtype=torch.float32, device=device)
        optimizer.zero_grad()
        if all_targets.numel() == 0:
            print("Batch de imágenes sin ningún target: saltado.")
            continue
        predictions = model(images)
        #print([p.shape for p in predictions])
        predictions = adapt_predictions_for_loss(predictions, num_classes=NUM_CLASSES)
        loss, components = loss_fn(predictions, all_targets)
        #loss.backward()
        #optimizer.step()
        #running_loss += loss.item()
        #box_loss += components['box_loss'].item()
        #obj_loss += components['obj_loss'].item()
        #noobj_loss += components['noobj_loss'].item()
        #class_loss += components['class_loss'].item()
        running_loss += float(loss)
        box_loss += float(components['box_loss'])
        obj_loss += float(components['obj_loss'])
        noobj_loss += float(components['noobj_loss'])
        class_loss += float(components['class_loss'])
    n = len(loader)
    if n == 0:
        return 0, 0, 0, 0, 0
    return (running_loss/n, box_loss/n, obj_loss/n, noobj_loss/n, class_loss/n)

print("Funciones de entrenamiento y validación definidas correctamente.")



Funciones de entrenamiento y validación definidas correctamente.


In [15]:
# Entrenamiento del modelo YOLO Version 3

# PASO 6: Loop principal de entrenamiento
patience = 10  # Epochs sin mejora antes de parar
epochs_no_improve = 0
best_val_loss = float('inf')
writer = SummaryWriter(log_dir='runs/yolov3_bloodcell')

for epoch in range(1, EPOCHS+1):
    print(f"\n=== Época {epoch}/{EPOCHS} ===")
    t_loss, t_box, t_obj, t_noobj, t_class = train_one_epoch(model, train_loader, loss_fn, optimizer, device)
    v_loss, v_box, v_obj, v_noobj, v_class = validate_one_epoch(model, val_loader, loss_fn, device)
    
    print(f"Train Loss: {t_loss:.4f} | Val Loss: {v_loss:.4f}")
    print(f"  [Train] Box: {t_box:.4f} Obj: {t_obj:.4f} NoObj: {t_noobj:.4f} Class: {t_class:.4f}")
    print(f"  [Val]   Box: {v_box:.4f} Obj: {v_obj:.4f} NoObj: {v_noobj:.4f} Class: {v_class:.4f}")

    # Early stopping y guardado del mejor modelo
    if v_loss < best_val_loss:
        best_val_loss = v_loss
        torch.save(model.state_dict(), "best_yolov3_bloodcell.pth")
        print(">> Modelo guardado (mejor Val Loss)")
        epochs_no_improve = 0
    else:
        epochs_no_improve += 1
        print(f"No mejora en val_loss. Paciencia: {epochs_no_improve}/{patience}")
        if epochs_no_improve >= patience:
            print("Early stopping activado: no hay mejora en la validación.")
            break

    # TensorBoard
    writer.add_scalar("Loss/Train", t_loss, epoch)
    writer.add_scalar("Loss/Val", v_loss, epoch)
    writer.add_scalar("Loss/Box_Train", t_box, epoch)
    writer.add_scalar("Loss/Box_Val", v_box, epoch)
    writer.add_scalar("Loss/Obj_Train", t_obj, epoch)
    writer.add_scalar("Loss/Obj_Val", v_obj, epoch)
    writer.add_scalar("Loss/NoObj_Train", t_noobj, epoch)
    writer.add_scalar("Loss/NoObj_Val", v_noobj, epoch)
    writer.add_scalar("Loss/Class_Train", t_class, epoch)
    writer.add_scalar("Loss/Class_Val", v_class, epoch)

print("Entrenamiento finalizado.")
writer.close()


=== Época 1/50 ===


Entrenando: 100%|██████████| 32/32 [00:58<00:00,  1.84s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.13it/s]


Train Loss: 11.2074 | Val Loss: 9.4275
  [Train] Box: 5.9325 Obj: 1.7231 NoObj: 1.6802 Class: 1.8716
  [Val]   Box: 5.3670 Obj: 1.2944 NoObj: 1.2440 Class: 1.5221
>> Modelo guardado (mejor Val Loss)

=== Época 2/50 ===


Entrenando: 100%|██████████| 32/32 [00:30<00:00,  1.06it/s]
Validando: 100%|██████████| 7/7 [00:05<00:00,  1.23it/s]


Train Loss: 8.5181 | Val Loss: 7.7988
  [Train] Box: 5.1447 Obj: 1.0600 NoObj: 0.9872 Class: 1.3262
  [Val]   Box: 5.0131 Obj: 0.8427 NoObj: 0.7805 Class: 1.1625
>> Modelo guardado (mejor Val Loss)

=== Época 3/50 ===


Entrenando: 100%|██████████| 32/32 [00:32<00:00,  1.01s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.11it/s]


Train Loss: 7.3319 | Val Loss: 6.9893
  [Train] Box: 4.8970 Obj: 0.7142 NoObj: 0.6597 Class: 1.0609
  [Val]   Box: 4.8630 Obj: 0.5963 NoObj: 0.5563 Class: 0.9737
>> Modelo guardado (mejor Val Loss)

=== Época 4/50 ===


Entrenando: 100%|██████████| 32/32 [00:32<00:00,  1.03s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.10it/s]


Train Loss: 6.6695 | Val Loss: 6.4792
  [Train] Box: 4.7639 Obj: 0.5208 NoObj: 0.4783 Class: 0.9065
  [Val]   Box: 4.7613 Obj: 0.4492 NoObj: 0.4097 Class: 0.8590
>> Modelo guardado (mejor Val Loss)

=== Época 5/50 ===


Entrenando: 100%|██████████| 32/32 [00:36<00:00,  1.14s/it]
Validando: 100%|██████████| 7/7 [00:11<00:00,  1.68s/it]


Train Loss: 6.2588 | Val Loss: 6.1192
  [Train] Box: 4.6756 Obj: 0.4031 NoObj: 0.3671 Class: 0.8130
  [Val]   Box: 4.6725 Obj: 0.3489 NoObj: 0.3201 Class: 0.7777
>> Modelo guardado (mejor Val Loss)

=== Época 6/50 ===


Entrenando: 100%|██████████| 32/32 [00:57<00:00,  1.80s/it]
Validando: 100%|██████████| 7/7 [00:05<00:00,  1.20it/s]


Train Loss: 5.9539 | Val Loss: 5.8715
  [Train] Box: 4.6063 Obj: 0.3162 NoObj: 0.2894 Class: 0.7419
  [Val]   Box: 4.6108 Obj: 0.2814 NoObj: 0.2569 Class: 0.7224
>> Modelo guardado (mejor Val Loss)

=== Época 7/50 ===


Entrenando: 100%|██████████| 32/32 [00:30<00:00,  1.04it/s]
Validando: 100%|██████████| 7/7 [00:05<00:00,  1.20it/s]


Train Loss: 5.7315 | Val Loss: 5.6799
  [Train] Box: 4.5451 Obj: 0.2615 NoObj: 0.2372 Class: 0.6876
  [Val]   Box: 4.5486 Obj: 0.2371 NoObj: 0.2159 Class: 0.6783
>> Modelo guardado (mejor Val Loss)

=== Época 8/50 ===


Entrenando: 100%|██████████| 32/32 [00:31<00:00,  1.01it/s]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.12it/s]


Train Loss: 5.5482 | Val Loss: 5.5186
  [Train] Box: 4.4824 Obj: 0.2181 NoObj: 0.1975 Class: 0.6503
  [Val]   Box: 4.5019 Obj: 0.1964 NoObj: 0.1793 Class: 0.6410
>> Modelo guardado (mejor Val Loss)

=== Época 9/50 ===


Entrenando: 100%|██████████| 32/32 [00:33<00:00,  1.03s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.12it/s]


Train Loss: 5.4099 | Val Loss: 5.3904
  [Train] Box: 4.4406 Obj: 0.1854 NoObj: 0.1674 Class: 0.6165
  [Val]   Box: 4.4615 Obj: 0.1666 NoObj: 0.1525 Class: 0.6098
>> Modelo guardado (mejor Val Loss)

=== Época 10/50 ===


Entrenando: 100%|██████████| 32/32 [00:33<00:00,  1.04s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.10it/s]


Train Loss: 5.3001 | Val Loss: 5.3036
  [Train] Box: 4.4077 Obj: 0.1601 NoObj: 0.1456 Class: 0.5866
  [Val]   Box: 4.4362 Obj: 0.1464 NoObj: 0.1331 Class: 0.5880
>> Modelo guardado (mejor Val Loss)

=== Época 11/50 ===


Entrenando: 100%|██████████| 32/32 [00:33<00:00,  1.04s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.11it/s]


Train Loss: 5.2061 | Val Loss: 5.2163
  [Train] Box: 4.3723 Obj: 0.1410 NoObj: 0.1270 Class: 0.5657
  [Val]   Box: 4.4023 Obj: 0.1289 NoObj: 0.1176 Class: 0.5675
>> Modelo guardado (mejor Val Loss)

=== Época 12/50 ===


Entrenando: 100%|██████████| 32/32 [00:33<00:00,  1.04s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.07it/s]


Train Loss: 5.1405 | Val Loss: 5.1465
  [Train] Box: 4.3547 Obj: 0.1235 NoObj: 0.1126 Class: 0.5496
  [Val]   Box: 4.3823 Obj: 0.1137 NoObj: 0.1027 Class: 0.5478
>> Modelo guardado (mejor Val Loss)

=== Época 13/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.03it/s]


Train Loss: 5.0642 | Val Loss: 5.0918
  [Train] Box: 4.3217 Obj: 0.1096 NoObj: 0.0992 Class: 0.5336
  [Val]   Box: 4.3666 Obj: 0.1010 NoObj: 0.0914 Class: 0.5328
>> Modelo guardado (mejor Val Loss)

=== Época 14/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.08it/s]


Train Loss: 4.9969 | Val Loss: 5.0221
  [Train] Box: 4.2991 Obj: 0.0974 NoObj: 0.0877 Class: 0.5127
  [Val]   Box: 4.3377 Obj: 0.0883 NoObj: 0.0805 Class: 0.5156
>> Modelo guardado (mejor Val Loss)

=== Época 15/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.06it/s]


Train Loss: 4.9484 | Val Loss: 4.9849
  [Train] Box: 4.2790 Obj: 0.0891 NoObj: 0.0812 Class: 0.4990
  [Val]   Box: 4.3197 Obj: 0.0837 NoObj: 0.0764 Class: 0.5051
>> Modelo guardado (mejor Val Loss)

=== Época 16/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.05it/s]


Train Loss: 4.9009 | Val Loss: 4.9464
  [Train] Box: 4.2605 Obj: 0.0809 NoObj: 0.0737 Class: 0.4858
  [Val]   Box: 4.3090 Obj: 0.0759 NoObj: 0.0696 Class: 0.4918
>> Modelo guardado (mejor Val Loss)

=== Época 17/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.08it/s]


Train Loss: 4.8641 | Val Loss: 4.9093
  [Train] Box: 4.2463 Obj: 0.0736 NoObj: 0.0677 Class: 0.4765
  [Val]   Box: 4.2960 Obj: 0.0683 NoObj: 0.0621 Class: 0.4828
>> Modelo guardado (mejor Val Loss)

=== Época 18/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.03it/s]


Train Loss: 4.8302 | Val Loss: 4.8758
  [Train] Box: 4.2294 Obj: 0.0676 NoObj: 0.0613 Class: 0.4719
  [Val]   Box: 4.2810 Obj: 0.0636 NoObj: 0.0582 Class: 0.4730
>> Modelo guardado (mejor Val Loss)

=== Época 19/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.06it/s]


Train Loss: 4.7904 | Val Loss: 4.8461
  [Train] Box: 4.2160 Obj: 0.0621 NoObj: 0.0568 Class: 0.4555
  [Val]   Box: 4.2705 Obj: 0.0583 NoObj: 0.0535 Class: 0.4638
>> Modelo guardado (mejor Val Loss)

=== Época 20/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.07it/s]


Train Loss: 4.7717 | Val Loss: 4.8166
  [Train] Box: 4.2082 Obj: 0.0574 NoObj: 0.0526 Class: 0.4536
  [Val]   Box: 4.2581 Obj: 0.0533 NoObj: 0.0485 Class: 0.4567
>> Modelo guardado (mejor Val Loss)

=== Época 21/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.05it/s]


Train Loss: 4.7443 | Val Loss: 4.7904
  [Train] Box: 4.1974 Obj: 0.0541 NoObj: 0.0491 Class: 0.4437
  [Val]   Box: 4.2475 Obj: 0.0494 NoObj: 0.0458 Class: 0.4477
>> Modelo guardado (mejor Val Loss)

=== Época 22/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.05it/s]


Train Loss: 4.7105 | Val Loss: 4.7715
  [Train] Box: 4.1858 Obj: 0.0487 NoObj: 0.0451 Class: 0.4309
  [Val]   Box: 4.2421 Obj: 0.0462 NoObj: 0.0429 Class: 0.4404
>> Modelo guardado (mejor Val Loss)

=== Época 23/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.02it/s]


Train Loss: 4.6870 | Val Loss: 4.7537
  [Train] Box: 4.1726 Obj: 0.0465 NoObj: 0.0425 Class: 0.4254
  [Val]   Box: 4.2344 Obj: 0.0444 NoObj: 0.0411 Class: 0.4338
>> Modelo guardado (mejor Val Loss)

=== Época 24/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.06it/s]


Train Loss: 4.6614 | Val Loss: 4.7372
  [Train] Box: 4.1629 Obj: 0.0425 NoObj: 0.0393 Class: 0.4167
  [Val]   Box: 4.2321 Obj: 0.0404 NoObj: 0.0370 Class: 0.4277
>> Modelo guardado (mejor Val Loss)

=== Época 25/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.06it/s]


Train Loss: 4.6486 | Val Loss: 4.7126
  [Train] Box: 4.1564 Obj: 0.0399 NoObj: 0.0372 Class: 0.4150
  [Val]   Box: 4.2169 Obj: 0.0382 NoObj: 0.0355 Class: 0.4221
>> Modelo guardado (mejor Val Loss)

=== Época 26/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.06it/s]


Train Loss: 4.6185 | Val Loss: 4.7009
  [Train] Box: 4.1404 Obj: 0.0379 NoObj: 0.0351 Class: 0.4050
  [Val]   Box: 4.2149 Obj: 0.0357 NoObj: 0.0330 Class: 0.4173
>> Modelo guardado (mejor Val Loss)

=== Época 27/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.09it/s]


Train Loss: 4.6130 | Val Loss: 4.6817
  [Train] Box: 4.1416 Obj: 0.0358 NoObj: 0.0332 Class: 0.4025
  [Val]   Box: 4.2038 Obj: 0.0338 NoObj: 0.0315 Class: 0.4126
>> Modelo guardado (mejor Val Loss)

=== Época 28/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.03it/s]


Train Loss: 4.5925 | Val Loss: 4.6679
  [Train] Box: 4.1325 Obj: 0.0335 NoObj: 0.0310 Class: 0.3955
  [Val]   Box: 4.2005 Obj: 0.0314 NoObj: 0.0290 Class: 0.4070
>> Modelo guardado (mejor Val Loss)

=== Época 29/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.08it/s]


Train Loss: 4.5803 | Val Loss: 4.6520
  [Train] Box: 4.1242 Obj: 0.0318 NoObj: 0.0295 Class: 0.3949
  [Val]   Box: 4.1921 Obj: 0.0298 NoObj: 0.0279 Class: 0.4023
>> Modelo guardado (mejor Val Loss)

=== Época 30/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.06it/s]


Train Loss: 4.5612 | Val Loss: 4.6399
  [Train] Box: 4.1147 Obj: 0.0302 NoObj: 0.0281 Class: 0.3882
  [Val]   Box: 4.1871 Obj: 0.0282 NoObj: 0.0265 Class: 0.3981
>> Modelo guardado (mejor Val Loss)

=== Época 31/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.05it/s]


Train Loss: 4.5475 | Val Loss: 4.6296
  [Train] Box: 4.1117 Obj: 0.0286 NoObj: 0.0268 Class: 0.3805
  [Val]   Box: 4.1832 Obj: 0.0270 NoObj: 0.0254 Class: 0.3941
>> Modelo guardado (mejor Val Loss)

=== Época 32/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.09it/s]


Train Loss: 4.5455 | Val Loss: 4.6133
  [Train] Box: 4.1108 Obj: 0.0275 NoObj: 0.0255 Class: 0.3817
  [Val]   Box: 4.1750 Obj: 0.0257 NoObj: 0.0239 Class: 0.3887
>> Modelo guardado (mejor Val Loss)

=== Época 33/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.04it/s]


Train Loss: 4.5324 | Val Loss: 4.6081
  [Train] Box: 4.0997 Obj: 0.0259 NoObj: 0.0241 Class: 0.3826
  [Val]   Box: 4.1733 Obj: 0.0246 NoObj: 0.0230 Class: 0.3873
>> Modelo guardado (mejor Val Loss)

=== Época 34/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.09it/s]


Train Loss: 4.5212 | Val Loss: 4.5988
  [Train] Box: 4.0983 Obj: 0.0242 NoObj: 0.0227 Class: 0.3760
  [Val]   Box: 4.1710 Obj: 0.0232 NoObj: 0.0217 Class: 0.3829
>> Modelo guardado (mejor Val Loss)

=== Época 35/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.08it/s]


Train Loss: 4.5091 | Val Loss: 4.5926
  [Train] Box: 4.0935 Obj: 0.0233 NoObj: 0.0217 Class: 0.3706
  [Val]   Box: 4.1693 Obj: 0.0217 NoObj: 0.0202 Class: 0.3814
>> Modelo guardado (mejor Val Loss)

=== Época 36/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.05it/s]


Train Loss: 4.5001 | Val Loss: 4.5785
  [Train] Box: 4.0884 Obj: 0.0228 NoObj: 0.0211 Class: 0.3677
  [Val]   Box: 4.1602 Obj: 0.0214 NoObj: 0.0200 Class: 0.3769
>> Modelo guardado (mejor Val Loss)

=== Época 37/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.07it/s]


Train Loss: 4.4968 | Val Loss: 4.5710
  [Train] Box: 4.0870 Obj: 0.0214 NoObj: 0.0198 Class: 0.3687
  [Val]   Box: 4.1590 Obj: 0.0200 NoObj: 0.0187 Class: 0.3733
>> Modelo guardado (mejor Val Loss)

=== Época 38/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.02it/s]


Train Loss: 4.4781 | Val Loss: 4.5694
  [Train] Box: 4.0820 Obj: 0.0202 NoObj: 0.0189 Class: 0.3570
  [Val]   Box: 4.1597 Obj: 0.0194 NoObj: 0.0181 Class: 0.3722
>> Modelo guardado (mejor Val Loss)

=== Época 39/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.07it/s]


Train Loss: 4.4731 | Val Loss: 4.5486
  [Train] Box: 4.0790 Obj: 0.0195 NoObj: 0.0183 Class: 0.3563
  [Val]   Box: 4.1471 Obj: 0.0188 NoObj: 0.0178 Class: 0.3650
>> Modelo guardado (mejor Val Loss)

=== Época 40/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.08it/s]


Train Loss: 4.4679 | Val Loss: 4.5460
  [Train] Box: 4.0725 Obj: 0.0189 NoObj: 0.0177 Class: 0.3588
  [Val]   Box: 4.1477 Obj: 0.0178 NoObj: 0.0170 Class: 0.3635
>> Modelo guardado (mejor Val Loss)

=== Época 41/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.04it/s]


Train Loss: 4.4562 | Val Loss: 4.5421
  [Train] Box: 4.0686 Obj: 0.0179 NoObj: 0.0166 Class: 0.3531
  [Val]   Box: 4.1477 Obj: 0.0164 NoObj: 0.0155 Class: 0.3625
>> Modelo guardado (mejor Val Loss)

=== Época 42/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.08it/s]


Train Loss: 4.4374 | Val Loss: 4.5352
  [Train] Box: 4.0585 Obj: 0.0171 NoObj: 0.0162 Class: 0.3456
  [Val]   Box: 4.1441 Obj: 0.0164 NoObj: 0.0156 Class: 0.3591
>> Modelo guardado (mejor Val Loss)

=== Época 43/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.04it/s]


Train Loss: 4.4375 | Val Loss: 4.5222
  [Train] Box: 4.0624 Obj: 0.0165 NoObj: 0.0156 Class: 0.3431
  [Val]   Box: 4.1354 Obj: 0.0154 NoObj: 0.0147 Class: 0.3566
>> Modelo guardado (mejor Val Loss)

=== Época 44/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.08it/s]


Train Loss: 4.4309 | Val Loss: 4.5158
  [Train] Box: 4.0569 Obj: 0.0158 NoObj: 0.0149 Class: 0.3433
  [Val]   Box: 4.1344 Obj: 0.0146 NoObj: 0.0139 Class: 0.3530
>> Modelo guardado (mejor Val Loss)

=== Época 45/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.10s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.07it/s]


Train Loss: 4.4295 | Val Loss: 4.5107
  [Train] Box: 4.0592 Obj: 0.0154 NoObj: 0.0145 Class: 0.3405
  [Val]   Box: 4.1318 Obj: 0.0145 NoObj: 0.0137 Class: 0.3507
>> Modelo guardado (mejor Val Loss)

=== Época 46/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.03it/s]


Train Loss: 4.4194 | Val Loss: 4.5118
  [Train] Box: 4.0507 Obj: 0.0149 NoObj: 0.0140 Class: 0.3398
  [Val]   Box: 4.1345 Obj: 0.0139 NoObj: 0.0132 Class: 0.3503
No mejora en val_loss. Paciencia: 1/10

=== Época 47/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.07it/s]


Train Loss: 4.4177 | Val Loss: 4.5021
  [Train] Box: 4.0523 Obj: 0.0142 NoObj: 0.0133 Class: 0.3380
  [Val]   Box: 4.1283 Obj: 0.0132 NoObj: 0.0126 Class: 0.3480
>> Modelo guardado (mejor Val Loss)

=== Época 48/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.11s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.03it/s]


Train Loss: 4.3976 | Val Loss: 4.4953
  [Train] Box: 4.0422 Obj: 0.0135 NoObj: 0.0129 Class: 0.3290
  [Val]   Box: 4.1251 Obj: 0.0132 NoObj: 0.0125 Class: 0.3445
>> Modelo guardado (mejor Val Loss)

=== Época 49/50 ===


Entrenando: 100%|██████████| 32/32 [00:36<00:00,  1.13s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.06it/s]


Train Loss: 4.3984 | Val Loss: 4.4909
  [Train] Box: 4.0420 Obj: 0.0132 NoObj: 0.0125 Class: 0.3307
  [Val]   Box: 4.1238 Obj: 0.0125 NoObj: 0.0119 Class: 0.3427
>> Modelo guardado (mejor Val Loss)

=== Época 50/50 ===


Entrenando: 100%|██████████| 32/32 [00:35<00:00,  1.12s/it]
Validando: 100%|██████████| 7/7 [00:06<00:00,  1.07it/s]


Train Loss: 4.3914 | Val Loss: 4.4849
  [Train] Box: 4.0383 Obj: 0.0128 NoObj: 0.0121 Class: 0.3281
  [Val]   Box: 4.1208 Obj: 0.0119 NoObj: 0.0112 Class: 0.3410
>> Modelo guardado (mejor Val Loss)
Entrenamiento finalizado.
