https://www.youtube.com/watch?v=qu2qAXr4Des&t=429s


Investigar metodo de autoguardado en el entrenamiento para no perder el avance.

‚úÖ Estrategia para retomar el entrenamiento en Colab:

Guardar checkpoints: Usa **model.save()** o PyTorch/TensorFlow **torch.save()** para guardar el progreso cada ciertas √©pocas.
Reanudar el entrenamiento: Carga el √∫ltimo checkpoint en una nueva sesi√≥n y contin√∫a desde ah√≠.
Dividir el entrenamiento: En lugar de 10 horas seguidas, entrena en bloques de 2-3 horas y guarda el progreso.

In [None]:
#----------------------------------------------------------------------------------------------------

Para lograr 100 epochs en 3 horas, puedes optimizar el entrenamiento de **YOLO11n** en Google Colab con las siguientes estrategias:  

### 1Ô∏è‚É£ **Usar una instancia m√°s potente (Colab Pro/Pro+)**  
Si est√°s en la versi√≥n gratuita, considera **Colab Pro o Pro+**, que te da acceso a GPUs m√°s r√°pidas como **T4, P100 o A100** (cuando est√° disponible).  

### 2Ô∏è‚É£ **Aumentar el tama√±o del batch (si tu GPU lo permite)**  
En tu configuraci√≥n tienes `batch=16`, pero si tu GPU tiene suficiente memoria, intenta **batch=32 o m√°s** para acelerar la convergencia.  

### 3Ô∏è‚É£ **Reducir el tama√±o de la imagen (`imgsz`)**  
Actualmente usas `imgsz=640`, pero podr√≠as probar **512 o incluso 416**, lo que reduce el tiempo por batch sin afectar demasiado la precisi√≥n.  

### 4Ô∏è‚É£ **Utilizar `cache` para evitar la sobrecarga de lectura de im√°genes**  
Si las im√°genes est√°n almacenadas en disco, activar el cache acelera el acceso:  
```python
model.train(..., cache=True)
```

### 5Ô∏è‚É£ **Activar `multi-scale` para entrenar m√°s r√°pido y robustecer el modelo**  
```python
model.train(..., multi_scale=True)
```

### 6Ô∏è‚É£ **Reducir el n√∫mero de workers para evitar cuellos de botella en Colab**  
Google Colab usa menos n√∫cleos para la carga de datos, prueba con:  
```python
model.train(..., workers=2)
```

### 7Ô∏è‚É£ **Guardar y reanudar el entrenamiento**  
Si se interrumpe el entrenamiento, puedes reanudarlo sin perder progreso usando el checkpoint m√°s reciente:  
```python
model.train(resume=True)
```
Si Colab se desconecta, puedes usar:
```python
model = YOLO('/ruta/al/ultimo/pesos.pt')  
```
Y continuar desde ah√≠.

---

### üöÄ **Configuraci√≥n optimizada**  
Prueba con estos par√°metros:  
```python
model.train(
    data='/content/merge1-1/data.yaml',
    epochs=100,
    imgsz=512,  # Reducido para mayor velocidad
    batch=32,  # Ajustado si la GPU lo permite
    cache=True,  # Evita lectura repetida de im√°genes
    multi_scale=True,  # Acelera y mejora la generalizaci√≥n
    workers=2,  # Ajustado para evitar cuellos de botella
    name="entrenamiento_epp",
    project="proyecto_epp"
)
```

Con estas optimizaciones, deber√≠as lograr los **100 epochs en menos de 3 horas**. üöÄüî•

-------------------------------------------------------------------------------------
S√≠, puedes reanudar el entrenamiento desde el √∫ltimo checkpoint sin perder el progreso anterior. Sigue estos pasos:  

---

### **üîÑ Paso 1: Verifica si tienes un checkpoint guardado**
Cuando `YOLO` entrena, autom√°ticamente guarda los pesos del modelo en la carpeta del proyecto. Busca la carpeta donde guardaste el entrenamiento, en tu caso:  

üìÇ **`/content/proyecto_epp/entrenamiento_epp/`**  

Dentro de esa carpeta, deber√≠a haber un archivo de pesos con un nombre similar a:  
- `last.pt` (√∫ltimo checkpoint guardado)  
- `best.pt` (mejor modelo seg√∫n validaci√≥n)  

---

### **üîÑ Paso 2: Cargar el √∫ltimo checkpoint**
En tu nueva sesi√≥n de Colab, monta Google Drive (si lo usaste) o revisa si los archivos a√∫n est√°n en `/content/`. Luego, carga el modelo con:  

```python
from ultralytics import YOLO  

# Cargar el √∫ltimo checkpoint
model = YOLO('/content/proyecto_epp/entrenamiento_epp/weights/last.pt')  

# Reanudar el entrenamiento
model.train(resume=True)
```

---

### **üõ†Ô∏è Explicaci√≥n**
- `YOLO('/ruta/al/archivo.pt')` ‚Üí Carga los pesos del √∫ltimo modelo.  
- `train(resume=True)` ‚Üí Contin√∫a desde donde qued√≥, manteniendo hiperpar√°metros y estad√≠sticas de entrenamiento.  

Si el archivo `last.pt` no est√° en `/content/`, revisa en Google Drive si lo guardaste antes. Si no lo encuentras, lamentablemente, tendr√°s que reiniciar desde **epoch 0**.  

---

### **üìå Recomendaci√≥n para el futuro**
Para evitar perder el progreso si Colab se cierra, guarda los pesos en Google Drive al finalizar cada sesi√≥n:  

```python
from google.colab import drive
drive.mount('/content/drive')

!cp -r /content/proyecto_epp /content/drive/MyDrive/
```

As√≠, la pr√≥xima vez solo copias de vuelta antes de reanudar:  

```python
!cp -r /content/drive/MyDrive/proyecto_epp /content/
```

¬°Con esto, no volver√°s a perder tu progreso! üöÄüî•

------------------------------------------------------------------------------------------------

Te recomiendo agregar un bloque de c√≥digo que verifique si ya existe el checkpoint (por ejemplo, el archivo `last.pt`) y, de ser as√≠, cargar ese modelo para reanudar el entrenamiento. Puedes hacer esto justo despu√©s de la parte en la que listas los archivos del directorio de resultados. Aqu√≠ te dejo un ejemplo de c√≥mo modificar tu c√≥digo:

---

### C√≥digo modificado con reanudaci√≥n de entrenamiento

```python
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import os
import matplotlib.pyplot as plt
from PIL import Image

!pip install split-folders pillow ultralytics
!pip install roboflow

from roboflow import Roboflow
rf = Roboflow(api_key="w1vFv4CrKeWMlQiAC4ti")
project = rf.workspace("patcontrol").project("merge1-svxaj")
version = project.version(1)
dataset = version.download("yolov11")

# Specify the path to the file
file_path = '/content/merge1-1/data.yaml'       # Copiar y pegar ruta del archivo yaml en el archivo anteriormente descargado

# Check if the file exists
if os.path.exists(file_path):
    print(f"The file at {file_path} exists.")
else:
    print(f"The file at {file_path} does not exist.")

# Get the current working directory
cwd = os.getcwd()
print(f"Current working directory: {cwd}")

# List all files and directories in the current directory
files = os.listdir(cwd)
print(f"Files and directories in '{cwd}': {files}")

from ultralytics import YOLO
# Inicialmente carga el modelo base
model = YOLO("yolo11n.pt")
model.info()

from ultralytics import settings
# Configurar la carpeta de datasets
settings.update({'datasets_dir': '/content/merge1-1'})    # Reemplazar ruta con ruta de nuestra carpeta descargada

# Entrenar el modelo (la primera vez)
# model.train(
#     data='/content/merge1-1/data.yaml',   # Reemplazar direccion de ruta del archivo .yaml
#     epochs=100,
#     imgsz=640,  
#     batch=16,  
#     name="entrenamiento_epp",          # Nombre del entrenamiento
#     project="proyecto_epp"             # Nombre del proyecto
# )

# Verificar si existe el checkpoint para reanudar el entrenamiento
checkpoint_path = "/content/proyecto_epp/entrenamiento_epp/weights/last.pt"
if os.path.exists(checkpoint_path):
    print("Checkpoint encontrado. Reanudando entrenamiento desde:", checkpoint_path)
    # Cargar el modelo desde el checkpoint
    model = YOLO(checkpoint_path)
    # Reanudar entrenamiento
    model.train(resume=True)
else:
    print("No se encontr√≥ checkpoint. Iniciando entrenamiento desde cero.")
    model.train(
        data='/content/merge1-1/data.yaml',
        epochs=100,
        imgsz=640,
        batch=16,
        name="entrenamiento_epp",
        project="proyecto_epp"
    )

# Listar archivos en el directorio de resultados
directory = "/content/proyecto_epp/entrenamiento_epp"   # Reemplazar ruta por carpeta donde se encuentran los resultados del entrenamiento
if os.path.exists(directory):
    print("Archivos en el directorio:")
    print(os.listdir(directory))
else:
    print(f"El directorio {directory} no existe.")
```

---

### Explicaci√≥n de los cambios

1. **Bloque comentado del entrenamiento inicial:**  
   He dejado comentada la llamada original a `model.train(...)` para que puedas usarla la primera vez que inicies el entrenamiento. Luego, si se cierra Colab y vuelves a ejecutar el cuaderno, el bloque condicional detectar√° si existe el checkpoint y reanudar√° desde all√≠.

2. **Verificaci√≥n del checkpoint:**  
   Se define la variable `checkpoint_path` con la ruta del archivo `last.pt` que se guarda autom√°ticamente durante el entrenamiento.  
   ```python
   checkpoint_path = "/content/proyecto_epp/entrenamiento_epp/weights/last.pt"
   ```

3. **Carga y reanudaci√≥n:**  
   Si el archivo existe, se carga el modelo usando ese checkpoint y se reanuda el entrenamiento con `model.train(resume=True)`.  
   ```python
   model = YOLO(checkpoint_path)
   model.train(resume=True)
   ```

4. **Caso sin checkpoint:**  
   Si no se encuentra el checkpoint, se inicia el entrenamiento desde cero con los par√°metros originales.

---

### Uso en futuras sesiones

Cuando tu Colab se cierre, aseg√∫rate de **guardar la carpeta de resultados** (por ejemplo, en Google Drive) para que el archivo `last.pt` est√© disponible en la siguiente sesi√≥n. Puedes copiar la carpeta a Drive y luego copiarla de vuelta al directorio de Colab antes de reanudar.

Con estos cambios, la pr√≥xima vez que ejecutes el cuaderno, se verificar√° la existencia del checkpoint y se reanudar√° el entrenamiento en lugar de comenzar desde cero. ¬°√âxito con tu proyecto!

------------------------------------------------------------------------------------------------------

In [1]:
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import os
import matplotlib.pyplot as plt
from PIL import Image

In [None]:
!pip install split-folders pillow ultralytics
!pip install roboflow



In [None]:
from roboflow import Roboflow
rf = Roboflow(api_key="w1vFv4CrKeWMlQiAC4ti")
project = rf.workspace("patcontrol").project("merge1-svxaj")
version = project.version(1)
dataset = version.download("yolov11")









loading Roboflow workspace...
loading Roboflow project...


In [None]:
# Specify the path to the file
file_path = '/content/merge1-1/data.yaml'       # Copiar y pegar ruta del archivo yaml en el archivo anteriormente descargado

# Check if the file exists
if os.path.exists(file_path):
    print(f"The file at {file_path} exists.")
else:
    print(f"The file at {file_path} does not exist.")

The file at /content/merge1-1/data.yaml exists.


In [None]:
# Get the current working directory
cwd = os.getcwd()
print(f"Current working directory: {cwd}")

# List all files and directories in the current directory
files = os.listdir(cwd)
print(f"Files and directories in '{cwd}': {files}")


Current working directory: /content
Files and directories in '/content': ['.config', 'yolo11n.pt', 'mi_carpeta_zip.zip', 'proyecto_epp', 'merge1-1', 'drive', 'sample_data']


In [None]:
# dir_path = cwd + "/sample_data"
# for files in os.listdir(dir_path):
#   os.remove(dir_path + "/" + files)
# os.rmdir(dir_path)

In [None]:
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.info()

YOLO11n summary: 181 layers, 2,624,080 parameters, 0 gradients, 6.6 GFLOPs


(181, 2624080, 0, 6.614336)

In [None]:
from ultralytics import settings
# View all settings
settings.update({'datasets_dir': '/content/merge1-1'})    #reemplazar ruta con ruta de nuestra carpeta descargada

In [None]:
# os.chdir("/content")
# Entrenar el modelo
model.train(
    data='/content/merge1-1/data.yaml',   #reemplazar direccion de ruta del archivo .yaml
    epochs=100,
    imgsz=640,  # Actualmente usa imgsz=640, pero podr√≠as probar 512 o incluso 416, lo que reduce el tiempo por batch sin afectar demasiado la precisi√≥n.
    batch=16,  # Ajusta seg√∫n tu GPU 16 recomendable
    name="entrenamiento_epp",          #nombre del entrenamiento
    project="proyecto_epp"             #nombre del proyecto
)

Ultralytics 8.3.90 üöÄ Python-3.11.11 torch-2.5.1+cu124 CPU (Intel Xeon 2.20GHz)
[34m[1mengine/trainer: [0mtask=detect, mode=train, model=yolo11n.pt, data=/content/merge1-1/data.yaml, epochs=100, time=None, patience=100, batch=16, imgsz=640, save=True, save_period=-1, cache=False, device=None, workers=8, project=proyecto_epp, name=entrenamiento_epp2, exist_ok=False, pretrained=True, optimizer=auto, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=False, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=False, classes=None, retina_masks=False, embed=None, show=False, save_frames=False, save_txt=False, save_conf=False, save_crop=False, show_lab

[34m[1mtrain: [0mScanning /content/merge1-1/train/labels.cache... 11572 images, 0 backgrounds, 0 corrupt: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 11572/11572 [00:00<?, ?it/s]


[34m[1malbumentations: [0mBlur(p=0.01, blur_limit=(3, 7)), MedianBlur(p=0.01, blur_limit=(3, 7)), ToGray(p=0.01, num_output_channels=3, method='weighted_average'), CLAHE(p=0.01, clip_limit=(1.0, 4.0), tile_grid_size=(8, 8))


[34m[1mval: [0mScanning /content/merge1-1/valid/labels.cache... 2392 images, 0 backgrounds, 0 corrupt: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 2392/2392 [00:00<?, ?it/s]


Plotting labels to proyecto_epp/entrenamiento_epp2/labels.jpg... 
[34m[1moptimizer:[0m 'optimizer=auto' found, ignoring 'lr0=0.01' and 'momentum=0.937' and determining best 'optimizer', 'lr0' and 'momentum' automatically... 
[34m[1moptimizer:[0m SGD(lr=0.01, momentum=0.9) with parameter groups 81 weight(decay=0.0), 88 weight(decay=0.0005), 87 bias(decay=0.0)
[34m[1mTensorBoard: [0mmodel graph visualization added ‚úÖ
Image sizes 640 train, 640 val
Using 0 dataloader workers
Logging results to [1mproyecto_epp/entrenamiento_epp2[0m
Starting training for 100 epochs...

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      1/100         0G      2.373      5.337      2.115         86        640:   5%|‚ñå         | 39/724 [10:03<2:56:45, 15.48s/it]


KeyboardInterrupt: 

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
import shutil
shutil.make_archive('/content/proyecto_epp/comprimido', 'zip', '/content')


In [None]:
from google.colab import files
files.download('/content/proyecto_epp/comprimido.zip')


In [None]:
import os

# Listar archivos en el directorio
directory = "/content/proyecto_epp/entrenamiento_epp"   #reemplazar ruta por carpeta donde se encuentran los resultados del entrenamiento
if os.path.exists(directory):
    print("Archivos en el directorio:")
    print(os.listdir(directory))
else:
    print(f"El directorio {directory} no existe.")

El directorio /content/proyecto_epp/entrenamiento_epp no existe.


In [None]:
# Crear DataFrame de m√©tricas de entrenamiento
df_metrics = pd.read_csv("/content/proyecto_placas/entrenamiento_placas/results.csv")   #agregar ruta de results.csv


# Mostrar algunas m√©tricas
print(df_metrics.head(5))

print(df_metrics.index.to_list())
print(df_metrics.columns.to_list())

df_metrics.describe()

In [None]:
print(df_metrics.columns.to_list())
# Graficar las m√©tricas
plt.figure(figsize=(12, 6))
plt.plot(df_metrics[['epoch']], df_metrics[['train/cls_loss']], label='Train Loss')
plt.plot(df_metrics[['epoch']], df_metrics[['metrics/mAP50(B)']], label='Val mAP@0.5')
plt.plot(df_metrics[['epoch']], df_metrics[['metrics/mAP50-95(B)']], label='Val mAP@0.5:0.95')
plt.plot(df_metrics[['epoch']], df_metrics[['metrics/precision(B)']], label='Validation Presicion')
plt.xlabel('√âpoca')
plt.ylabel('Valor')
plt.title('M√©tricas de Entrenamiento')
plt.legend()
plt.show()

In [None]:
# Evaluar el modelo
results = model.val()

# Mostrar los resultados
print(results)

In [None]:
# Cargar el modelo entrenado
# modelo_entrenado = YOLO("/content/yolov8n.pt")
modelo_entrenado = YOLO("/content/proyecto_placas/entrenamiento_placas/weights/best.pt")    # Reemplazar ruta de best.pt

# Realizar inferencia en una imagen
resultados = modelo_entrenado.predict(source="/content/Imagen de WhatsApp 2024-12-11 a las 10.00.37_a5daf3b0.jpg", save=True)   # Reemplazar por ruta imagen que nos sirva para hacer una inferencia

# Acceder a los resultados
for resultado in resultados:
    print(f"Predicciones para la imagen: {resultado.path}")

    for caja, conf, clase in zip(resultado.boxes.xyxy, resultado.boxes.conf, resultado.boxes.cls):
        print(f"Bounding Box: {caja} - Confianza: {conf} - Clase: {clase}")

In [None]:
# Cargar y mostrar la imagen con las predicciones
img = Image.open("/content/runs/detect/predict/Imagen de WhatsApp 2024-12-11 a las 10.00.37_a5daf3b0.jpg")  # Reemplazar por ruta de acceso a imagen .jpg
plt.imshow(img)
plt.axis('off')  # Ocultar los ejes
plt.show()

In [None]:
import shutil
from google.colab import files

# Especifica el nombre de la carpeta que deseas comprimir y descargar
folder_path = "/content/proyecto_placas"  # Ruta de la carpeta en Colab
output_filename = "brayan_placas_v4.zip"   # Nombre del archivo zip de salida

# Comprimir la carpeta en un archivo ZIP
shutil.make_archive(output_filename.replace('.zip', ''), 'zip', folder_path)

# Descargar el archivo ZIP
files.download(output_filename)
