<a href="https://colab.research.google.com/github/mariasuescum/G3-COMPUTER-VISION/blob/feat%2Fnotebook-training/model_training_medium_colab_run_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Entrenamiento de YOLOv8 en Google Colab (Dataset Pre-descomprimido)

Este notebook está adaptado para entrenar un modelo YOLOv8, asumiendo que el dataset ya está descomprimido en Google Drive. Guarda los resultados en Google Drive y tiene capacidad de reanudar el entrenamiento si la sesión se interrumpe.

### 1. Montar Google Drive

Conecta el notebook a tu Google Drive. Aquí es donde leeremos el dataset y guardaremos los resultados y checkpoints.

In [10]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


### 2. Instalar Librerías

Instalamos `ultralytics` para YOLOv8.

In [11]:
!pip install ultralytics



### 3. Configuración del Entrenamiento

**ACCIÓN REQUERIDA:** Ajusta las rutas y parámetros en la siguiente celda según tu configuración.

In [12]:
import os
from ultralytics import YOLO

# --- PARÁMETROS DE CONFIGURACIÓN ---

# Asegurarse de que CUDA_VISIBLE_DEVICES esté configurado para usar la primera GPU
os.environ['CUDA_VISIBLE_DEVICES'] = '0'

# Ruta base en tu Google Drive donde tienes el proyecto
# DEBES AJUSTAR ESTA RUTA a donde hayas guardado tu dataset
DRIVE_PROJECT_PATH = '/content/drive/MyDrive/Colab Notebooks/mod03-projects/project-xii-computer-vision' # Asegúrate de que esta ruta sea correcta

# --- Configuración del Dataset (ya descomprimido) ---
# Ruta a la carpeta del dataset ya descomprimido en Drive
DATASET_BASE_PATH = os.path.join(DRIVE_PROJECT_PATH, 'dataset_v1_yolov8_reduced')

# Ruta al archivo YAML del dataset
DATASET_YAML_PATH = os.path.join(DATASET_BASE_PATH, 'data.yaml')

# Modelo, epochs y nombre del run
MODEL_NAME = os.path.join(DRIVE_PROJECT_PATH, 'models', 'yolov8m.pt') # Ruta explícita al modelo base en Drive
EPOCHS = 80
RUN_NAME = 'yolov8m_colab_80_epochs_run_2' # Nombre del run actualizado

# Parámetros de rendimiento para Colab
BATCH_SIZE = 8
IMG_SIZE = 640
WORKERS = 4
patience = 20 # Early stopping: detiene el entrenamiento si no hay mejora en 20 épocas
cache = True # Cachea las imágenes en RAM para acelerar la carga (si la RAM lo permite)
optimizer = 'AdamW' # Optimizador AdamW para una convergencia más estable
cos_lr = True # Usa decaimiento de learning rate con coseno annealing

# --- FIN DE LA CONFIGURACIÓN ---

# Asegurarse de que la carpeta de resultados exista en Drive
os.makedirs(os.path.join(DRIVE_PROJECT_PATH, 'training_results'), exist_ok=True)

# --- Verificación del Dataset y Modelo Base ---
if not os.path.exists(DATASET_YAML_PATH):
    print(f"ERROR: El archivo data.yaml no se encontró en {DATASET_YAML_PATH}. Asegúrate de que el dataset esté descomprimido en la ruta correcta.")
    raise FileNotFoundError(f"Dataset YAML not found at {DATASET_YAML_PATH}") # Detener la ejecución si el dataset no se encuentra

if not os.path.exists(MODEL_NAME):
    print(f"ADVERTENCIA: El modelo base {MODEL_NAME} no se encontró en la ruta especificada. Ultralytics lo descargará automáticamente.")
    MODEL_NAME = 'yolov8m.pt' # Volver al nombre corto para que Ultralytics lo descargue

print(f"Dataset listo en: {DATASET_BASE_PATH}")

Dataset listo en: /content/drive/MyDrive/Colab Notebooks/mod03-projects/project-xii-computer-vision/dataset_v1_yolov8_reduced


### 4. Entrenar el Modelo

Esta celda inicia o reanuda el entrenamiento. Gracias a `resume=True`, si el script se detiene, puedes volver a ejecutar esta celda y continuará donde lo dejó.

In [13]:
from ultralytics import YOLO

# Cargar el modelo base (YOLO descargará 'yolov8m.pt' si no existe)
model = YOLO(MODEL_NAME)

# Iniciar el entrenamiento
results = model.train(
    # --- Rutas y Datos ---
    data=DATASET_YAML_PATH,
    project=os.path.join(DRIVE_PROJECT_PATH, 'training_results'), # Guarda los resultados en Drive
    name=RUN_NAME,

    # --- Parámetros de Entrenamiento ---
    epochs=EPOCHS,
    resume=False,  # <-- ¡LA CLAVE! Reanuda el entrenamiento si encuentra un checkpoint

    # --- Parámetros de Rendimiento y Optimización ---
    batch=BATCH_SIZE,
    imgsz=IMG_SIZE,
    workers=WORKERS,
    patience=patience,
    cache=cache,
    optimizer=optimizer,
    cos_lr=cos_lr,

    # --- Opcionales ---
    save_json=True,
    save_hybrid=True,
    plots=True,
    device='0' # Forzar el uso de la GPU 0
)

print('--- ENTRENAMIENTO FINALIZADO ---')
print(f'Resultados guardados en: {results.save_dir}')

Ultralytics 8.3.192 🚀 Python-3.12.11 torch-2.8.0+cu126 CUDA:0 (Tesla T4, 15095MiB)
[34m[1mengine/trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=8, bgr=0.0, box=7.5, cache=True, cfg=None, classes=None, close_mosaic=10, cls=0.5, conf=None, copy_paste=0.0, copy_paste_mode=flip, cos_lr=True, cutmix=0.0, data=/content/drive/MyDrive/Colab Notebooks/mod03-projects/project-xii-computer-vision/dataset_v1_yolov8_reduced/data.yaml, degrees=0.0, deterministic=True, device=0, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=80, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=640, int8=False, iou=0.7, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=300, mixup=0.0, mode=train, model=/content/drive/MyDrive/Colab Notebooks/mod03-projects/project-xii-computer-vision/models/yolov8m.pt, momentum=0.937, mosa

### 5. Evaluar el Modelo Final

Una vez finalizado el entrenamiento completo, puedes ejecutar esta celda para ver las métricas de validación del mejor modelo.

In [14]:
# Cargar el mejor modelo guardado durante el entrenamiento
best_model_path = os.path.join(DRIVE_PROJECT_PATH, 'training_results', RUN_NAME, 'weights', 'best.pt')
model = YOLO(MODEL_NAME)

# Evaluar en el conjunto de validación
metrics = model.val()

print('--- MÉTRICAS DE VALIDACIÓN ---')
print(f'mAP50-95: {metrics.box.map:.4f}')
print(f'   mAP50: {metrics.box.map50:.4f}')
print(f'   mAP75: {metrics.box.map75:.4f}')

Ultralytics 8.3.192 🚀 Python-3.12.11 torch-2.8.0+cu126 CUDA:0 (Tesla T4, 15095MiB)
YOLOv8m summary (fused): 92 layers, 25,886,080 parameters, 0 gradients, 78.9 GFLOPs

[KDownloading https://ultralytics.com/assets/coco2017labels-segments.zip to '/content/datasets/coco2017labels-segments.zip': 100% ━━━━━━━━━━━━ 168.5/168.5MB 96.1MB/s 1.8s
[KUnzipping /content/datasets/coco2017labels-segments.zip to /content/datasets/coco...: 100% ━━━━━━━━━━━━ 122232/122232 5797.5files/s 21.1s
Downloading 3 file(s) with 3 threads to /content/datasets/coco/images...
[KDownloading http://images.cocodataset.org/zips/val2017.zip to '/content/datasets/coco/images/val2017.zip': 100% ━━━━━━━━━━━━ 777.8/777.8MB 24.1MB/s 32.3s
[KUnzipping /content/datasets/coco/images/val2017.zip to /content/datasets/coco/images/val2017...: 100% ━━━━━━━━━━━━ 5001/5001 234.6files/s 21.3s
[KDownloading http://images.cocodataset.org/zips/test2017.zip to '/content/datasets/coco/images/test2017.zip': 100% ━━━━━━━━━━━━ 6.2/6.2GB 26

KeyboardInterrupt: 