CONEXIÓN CON GOOGLE DRIVE

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


INSTALAMOS LOS PAQUETES NECESARIOS

In [2]:
pip install torch torchvision matplotlib

Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch)
  Downloading nvidia_cublas_cu12-12.4.5.8-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.2.1.3 (from torch)
  Downloading nvidia_cufft_cu12-11.2.1.3-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-curand-cu12==10.3.5.147 (from torch)
  Downloading nvidia_curand_cu12-10.3.5

CARGAMOS LAS LIBRERÍAS NECESARIAS

In [3]:
import os
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, models, transforms
from torch.utils.data import DataLoader
import numpy as np
from sklearn.metrics import accuracy_score, recall_score, average_precision_score


FUNCION DE TRANSFORMACIÓN DE IMÁGENES Y CREACIÓN DATASETS Y DATALOADERS

In [4]:
# Transformación para las imágenes
transforma = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(), #pasa la imagen a tensor para que pueda ser procesada
    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                         std=[0.229, 0.224, 0.225]) #normalizamos las imágenes
])

# Creamos los datasets
data_dir = '/content/drive/MyDrive/TFM/Lado/dataset' #ruta al dataset
train_data = datasets.ImageFolder(os.path.join(data_dir, 'train'), transform=transforma)
val_data = datasets.ImageFolder(os.path.join(data_dir, 'val'), transform=transforma)
test_data = datasets.ImageFolder(os.path.join(data_dir, 'test'), transform=transforma)

# Creamos los dataloaders
train_loader = DataLoader(train_data, batch_size=32, shuffle=True)
val_loader = DataLoader(val_data, batch_size=32, shuffle=False)
test_loader = DataLoader(test_data, batch_size=32, shuffle=False)

ENTRENAMIENTO DEL MODELO BASADO EN RESNET50

In [5]:
#Creamos la variable devide para forzar el uso de gpu en caso de que esté disponible
#ya que de otro modo el entrenamiento llevará mucho tiempo
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Cargar modelo preentrenado de Resnet50
model_side = models.resnet50(pretrained=True)

# Reemplazamos la capa final para 2 clases (left, right)

num_ftrs = model_side.fc.in_features # nº activaciones de entrada de última fc layer
model_side.fc = nn.Linear(num_ftrs, 2)  # modificación de última capa fc del modelo
#salida.

# Pasar el modelo a GPU si está disponible
model_side = model_side.to(device)

Downloading: "https://download.pytorch.org/models/resnet50-0676ba61.pth" to /root/.cache/torch/hub/checkpoints/resnet50-0676ba61.pth
100%|██████████| 97.8M/97.8M [00:00<00:00, 156MB/s]


In [6]:
# Definimos función de pérdida y optimizador
loss_fn = nn.CrossEntropyLoss()
optimizer = optim.Adam(model_side.parameters(), lr=0.001)

ENTRENAMIENTO DEL MODELO Y GRABACIÓN DE LOS PESOS DEL MEJOR EN BASE A LA PRECISIÓN

In [None]:
#Creamos la variable de "mejor precisión":

best_acc = 0.0

#Establecemos el número de épocas y comenzamos el bucle de entrenamiento

for epoch in range(10):
    model_side.train() #se pone el modelo en modo entrenamiento
    running_loss = 0.0
    correct = 0 #resultados correctos
    total = 0 #total de resultados

    for inputs, labels in train_loader: #bucle en train_loader
        inputs, labels = inputs.to(device), labels.to(device) #forzamos uso de gpu

        optimizer.zero_grad() #limpiamos los gradientes acumulados
        outputs = model_side(inputs) #pasa las imágenes del train por el modelo
        loss = loss_fn(outputs, labels) #compara resultados con labels
        loss.backward() #backpropagation
        optimizer.step() #aplica los cambios a los pesos del modelo

        running_loss += loss.item()
        max_vals, preds = torch.max(outputs, 1) #Obtenemos las probabilidades
        #y las categorías de lado predichas
        correct += (preds == labels).sum().item() #Acumulamos las predicciones
        #correctas
        total += labels.size(0) #Acumulamos el total de resultados para
        #obtener la precisión.

    epoch_loss = running_loss / len(train_loader) #Pérdida media
    epoch_acc = correct / total #precisión de la época

    print(f'Epoch {epoch + 1}/10 - Loss: {epoch_loss:.4f} - Acc: {epoch_acc:.4f}')

    # Si la precisión mejora, guarda el modelo con mejor precisión.
    if epoch_acc > best_acc:
        best_acc = epoch_acc
        torch.save(model_side.state_dict(), '/content/drive/MyDrive/TFM/modelos/model_side_weights6.pth')
        print(f'Modelo mejorado con precisión: {epoch_acc:.4f}')

print(f'Mejor precisión: {best_acc:.4f}')

CARGA DEL MODELO CON LOS PESOS OPTIMIZADOS

In [7]:
# Cargar modelo con los pesos entrenados
model_side.load_state_dict(torch.load('/content/drive/MyDrive/TFM/modelos/model_side_weights6.pth', map_location=device))

<All keys matched successfully>

EVALUACIÓN DEL MODELO CON EL CONJUNTO DE VALIDACIÓN


In [8]:
model_side.eval() # modelo en modo evaluación
all_preds = []
all_labels = []
all_scores = []

with torch.no_grad():
    for inputs, labels in val_loader: #bucle en val_loader
        inputs = inputs.to(device)
        labels = labels.to(device)
        outputs = model_side(inputs)

        # Obtener las probabilidades
        scores = torch.nn.functional.softmax(outputs, dim=1) #Se obtienen las
        # probabilidades de cada clase
        all_scores.append(scores.cpu().numpy()) #conversión a numpy para
        # almacenar en la lista

        # Obtener la categoría más probable (derecha o izquierda)
        max_vals, preds = torch.max(outputs, 1)

        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(labels.cpu().numpy())

# Calcular Precisión
accuracy = accuracy_score(all_labels, all_preds)

# Calcular Recall
recall = recall_score(all_labels, all_preds, average='micro')

# Calcular mAP (Mean Average Precision)
all_scores = np.concatenate(all_scores, axis=0)  # Concatenar todas las puntuaciones de los batchs
all_labels = np.array(all_labels) # transformación en one hot encoding
mAP = average_precision_score(np.eye(outputs.size(1))[all_labels], all_scores, average='micro')

print(f'Accuracy: {accuracy * 100:.2f}% - Recall: {recall * 100:.2f}% - mAP: {mAP * 100:.2f}%')

Accuracy: 99.41% - Recall: 99.41% - mAP: 99.94%


EVALUACIÓN DEL MODELO CON EL CONJUNTO DE TEST

In [9]:
model_side.eval() # modelo en modo evaluación
all_preds = []
all_labels = []
all_scores = []

with torch.no_grad():
    for inputs, labels in test_loader: #bucle en test_loader
        inputs = inputs.to(device)
        labels = labels.to(device)
        outputs = model_side(inputs)

        # Obtener las probabilidades
        scores = torch.nn.functional.softmax(outputs, dim=1) #Se obtienen las
        # probabilidades de cada clase
        all_scores.append(scores.cpu().numpy()) #conversión a numpy para
        # almacenar en la lista

        # Obtener la categoría más probable (derecha o izquierda)
        max_vals, preds = torch.max(outputs, 1)

        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(labels.cpu().numpy())

# Calcular Precisión
accuracy = accuracy_score(all_labels, all_preds)

# Calcular Recall
recall = recall_score(all_labels, all_preds, average='micro')

# Calcular mAP (Mean Average Precision)
all_scores = np.concatenate(all_scores, axis=0)  # Concatenar todas las puntuaciones de los batchs
all_labels = np.array(all_labels) # transformación en one hot encoding
mAP = average_precision_score(np.eye(outputs.size(1))[all_labels], all_scores, average='micro')

print(f'Accuracy: {accuracy * 100:.2f}% - Recall: {recall * 100:.2f}% - mAP: {mAP * 100:.2f}%')

Accuracy: 99.42% - Recall: 99.42% - mAP: 99.97%
