# **IMPORTS AND CHECKING OF THE GPU**

In [None]:
#import PyTorch libraries
import os
%pylab inline
import torch
import torchvision
from torch import nn
import torch.optim as optim
import tarfile
from torchvision.datasets.utils import download_url
from torch.utils.data import random_split
import zipfile
from google.colab import drive
drive.mount('/content/drive') #lo concecto con mi drive

#for TensorBoard
%load_ext tensorboard
from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter()

#Import visualization library
import matplotlib.pyplot as plt

#Verify PyTorch version
print(torch.__version__)

In [None]:
#Check to see if we have a GPU to use for training
device = 'cuda' if torch.cuda.is_available() else 'cpu'
print('A {} device was detected.'.format(device))

#Print the name of the cuda device, if detected
if device == 'cuda':
  print (torch.cuda.get_device_name(device=device))

# **LOADING THE DATA**

In [None]:
directory = './data'
if not os.path.exists(directory):
    os.mkdir(directory)

In [None]:
# Descomprimir el zip con el dataset
with zipfile.ZipFile("./drive/MyDrive/Colab Notebooks/QuantumKernelsPlayDogsVSCats/datasetCatsVSDogs.zip","r") as z:
    z.extractall("./data")

In [None]:
data_dir = './data/datasetCatsVSDogs'

print(os.listdir(data_dir))
classes = os.listdir(data_dir + "/train")
print(classes)

In [None]:
from torchvision.datasets import ImageFolder
from torchvision.transforms import transforms
from torchvision.utils import save_image

In [None]:
transform = transforms.Compose(
    [transforms.Resize((32,32)),
     transforms.ToTensor()])
     #transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])])  #transforma todas las imagenes en el mismo tamaño de 32x32 pixeles

dataset = ImageFolder(data_dir+'/train', transform=transform)
type(dataset)

In [None]:
transform = transforms.Compose(
    [transforms.Resize((32,32)),
     transforms.ToTensor()])  #transforma todas las imagenes en el mismo tamaño de 32x32 pixeles

dataset = ImageFolder(data_dir+'/train', transform=transform)


dataAugmentation_transform = transforms.Compose([
     #transforms.ToPILImage(),
     transforms.Resize((32,32)),
     #transforms.RandomCrop((30,30)),
     #transforms.ColorJitter(brightness=0.5),
     transforms.RandomRotation(degrees=45),
     transforms.RandomHorizontalFlip(p=0.5),
     transforms.RandomVerticalFlip(p=0.5),
     transforms.RandomGrayscale(p=0.2),
     transforms.ToTensor()
     ])

datasetAugmented = ImageFolder(data_dir+'/train', transform= dataAugmentation_transform)

#img_num = 0
#for img,label in datasetAugmented:
#  save_image(img, 'img'+str(img_num)+'.jpg')
#  img_num += 1


dataset1= torch.utils.data.ConcatDataset([dataset, datasetAugmented])

In [None]:
dataset.imgs[-10:]

In [None]:
img, label = dataset[0]
print(len(dataset))
print(img.shape, label)
print(dataset.classes)
print(dataset)

In [None]:
#Para imprimir un par de imagenes del dataset
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline

matplotlib.rcParams['figure.facecolor'] = '#ffffff'


def show_example(img, label):
    print('Label: ', dataset.classes[label], "("+str(label)+")")
    plt.imshow(img.permute(1, 2, 0))

In [None]:
show_example(*dataset[0])

In [None]:
show_example(*dataset[8000])

# **TRAINING AND VALIDATION DATASETS**

A partir del dataset formado por todas las imagenes de train, se separa en el dataset de train (train_ds) y el dataset para validation (val_ds)

In [None]:
#Creación del validation set
random_seed = 42
torch.manual_seed(random_seed);

In [None]:
val_size = 500 #aquí se ajusta el tamaño del validation set
train_size = len(dataset) - val_size

train_ds, val_ds = random_split(dataset, [train_size, val_size])
len(train_ds), len(val_ds)

Luego el train_ds y el val_ds se separan cada uno de ellos en batches de imagenes

In [None]:
from torch.utils.data.dataloader import DataLoader

batch_size=32 #aquí se ajusta el tamaño de los batch, se suele ir doblando 64, 128, 256...

In [None]:
#creacion del train dataloader y validation dataloader que crean los batches
train_dl = DataLoader(train_ds, 
                      batch_size, 
                      shuffle=True, 
                      num_workers=2, 
                      pin_memory=True)
val_dl = DataLoader(val_ds, 
                    batch_size*2, 
                    num_workers=2, 
                    pin_memory=True) #duplicamos el batch_size para el validation dataloader porque no vamos usar gradiente para la validation por lo que solo necesitaremos la mitad de la memoria

In [None]:
#funcion para mostrar uno de los batches
from torchvision.utils import make_grid

def show_batch(dl):
    for images, labels in dl:
        fig, ax = plt.subplots(figsize=(12, 6))
        ax.set_xticks([]); ax.set_yticks([])
        ax.imshow(make_grid(images, nrow=16).permute(1, 2, 0))
        break

#mostramos uno de los batches del train_dl
show_batch(train_dl)

# **DEFINING DE MODEL (CNN)**

In [None]:
#función que realiza la operación de convolution
def apply_kernel(image, kernel):
    ri, ci = image.shape       # image dimensions
    rk, ck = kernel.shape      # kernel dimensions
    ro, co = ri-rk+1, ci-ck+1  # output dimensions
    output = torch.zeros([ro, co])
    for i in range(ro): 
        for j in range(co):
            output[i,j] = torch.sum(image[i:i+rk,j:j+ck] * kernel)
    return output

In [None]:
#MODELO DE PRUEBA CON UNA SOLA CONVOLUTIONAL LAYER
simple_model = nn.Sequential(
    nn.Conv2d(3, 8, kernel_size=3, stride=1, padding=1), #3 canales de entrada (,G,B), 8 canales de salida, kernel de 3x3, stride de 1 y padding de 1
    nn.MaxPool2d(2, 2) # reduce a la mitad el alto y ancho de las imagenes
)

In [None]:
for images, labels in train_dl:
    print('images.shape:', images.shape)
    out = simple_model(images)
    print('out.shape:', out.shape)
    break
#toma un batch de 128 imagenes, 3 canales (R,G,B) e imagenes de 128x128 pixeles y devuelve --> un batch de 128 imagenes, 8 canales e imagenes de 64x64 pixeles

Primero definimos un modelo base llamado ImageClassificationBase que contiene métodos (funciones) de ayuda para el training y validation, y que son comunmente usadas.

In [None]:
import torch.nn.functional as F

In [None]:
class ImageClassificationBase(nn.Module):
    def training_step(self, batch): #self representa el objeto que se va a ir creando eventualmente (sería como el propio modelo)
        images, labels = batch 
        out = self(images)                  # Generate predictions, se pasa el batch de images al modelo(self)
        loss = F.cross_entropy(out, labels) # Calculate loss       
        #acc = accuracy(out, labels)           # Calculate accuracy
        return loss
        #return {'train_loss': loss.detach(), 'train_acc': acc}
    
    def validation_step(self, batch):
        images, labels = batch 
        out = self(images)                    # Generate predictions, se pasa el batch de images al modelo(self)
        loss = F.cross_entropy(out, labels)   # Calculate loss
        acc = accuracy(out, labels)           # Calculate accuracy
        return {'val_loss': loss.detach(), 'val_acc': acc} #devuelve la perdida de validation y la precisión de validation             #COMENTADO PARA IMPRIMIR TRAIN_ACC EN TB
        
    def validation_epoch_end(self, outputs): #toma las perdidas y precisiones de todos los diferentes batches del validation data y los combina calculando su media y devuelve una unica perdida y precisión para todo el validation set
        batch_losses = [x['val_loss'] for x in outputs]
        epoch_loss = torch.stack(batch_losses).mean()   # Combine losses
        batch_accs = [x['val_acc'] for x in outputs]
        epoch_acc = torch.stack(batch_accs).mean()      # Combine accuracies
        return {'val_loss': epoch_loss.item(), 'val_acc': epoch_acc.item()}                                                            #COMENTADO PARA IMPRIMIR TRAIN_ACC EN TB
    
    def epoch_end(self, epoch, result): #toma los resultados del epoch y los muestra
        print("Epoch [{}], train_loss: {:.4f}, val_loss: {:.4f}, val_acc: {:.4f}".format(
            epoch, result['train_loss'], result['val_loss'], result['val_acc']))
        
def accuracy(outputs, labels): #esta funcion calcula la precision de la prediccion
    _, preds = torch.max(outputs, dim=1)
    return torch.tensor(torch.sum(preds == labels).item() / len(preds)) #devuelve la etiqueta(label) que más aparece y la compara con las verdaderas etiquetas

Ahora creamos nuestro propio modelo que extiende el ImageClassificationBase

In [None]:
class CatsVSDogsCnnModel(ImageClassificationBase):
    def __init__(self):
        super().__init__()
        self.network = nn.Sequential( #self.network va pasando la salida de una capa a la entrada de la siguiente
            #input: 3 x 32 x 32
            nn.Conv2d(3, 32, kernel_size=3, padding=1), #3 canales de entrada y 32 canales de salida, es decir 32 kernels
            #output: 32 x 32 x 32
            nn.ReLU(), #aplica la funcion de activacion, los valores negativos los convierte en 0 y los positivos los mantiene
            #output: 32 x 32 x 32
            nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1), #hay 64 kernels
            #output: 64 x 32 x 32
            nn.ReLU(),
            #output: 64 x 32 x 32
            nn.MaxPool2d(2, 2), # output: 64 x 16 x 16

            nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.Conv2d(128, 128, kernel_size=3, stride=1, padding=1), #en esta capa no se incrementa el numero de canales, pero aun así al incluir estas capas se hace que haya mas valores que puedan ser entrenados en el modelo
            nn.ReLU(),
            nn.MaxPool2d(2, 2), # output: 128 x 8 x 8

            nn.Conv2d(128, 256, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.Conv2d(256, 256, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(2, 2), # output: 256 x 4 x 4
            #se podrían seguir añadiendo capas convolucionales y mas Poolings, hasta aquí tenemos 6 convolutional layers

            nn.Flatten(), #aplanamos el output final, es decir, lo convertimos a vector
            nn.Linear(256*4*4, 1024), #le pasamos como input el vector a una capa linear
            nn.ReLU(),
            nn.Linear(1024, 512),
            nn.ReLU(),
            nn.Linear(512, 2))
        
    def forward(self, xb):
        return self.network(xb)

In [None]:
model = CatsVSDogsCnnModel()
model

Probar el modelo con un batch de imagenes del train_dl para ver que funciona correctamente

In [None]:
for images, labels in train_dl:
    print('images.shape:', images.shape)
    out = model(images)
    print('out.shape:', out.shape)
    print('out[0]:', out[0])
    break
#devuelve esto:
  #images.shape: torch.Size([128, 3, 32, 32])  --> Toma como entrada un batch de 128 imagenes, de 3 canales y 32x32 pixeles
  #out.shape: torch.Size([128, 2]) --> la salida es un batch de 128 vectores con 2 valores cada vector
  #out[0]: tensor([-0.0225, -0.0190], grad_fn=<SelectBackward0>)  --> el vector 0 tiene esos valores siendo el primero la probabilidad de ser un gato y la segunda la de ser un perro

Funciones alternativas para elegir GPU o CPU, mover los datos a la gpu...

In [None]:
def get_default_device():
    """Pick GPU if available, else CPU"""
    if torch.cuda.is_available():
        return torch.device('cuda')
    else:
        return torch.device('cpu')
    
def to_device(data, device):
    """Move tensor(s) to chosen device"""
    if isinstance(data, (list,tuple)):
        return [to_device(x, device) for x in data]
    return data.to(device, non_blocking=True)

class DeviceDataLoader():
    """Wrap a dataloader to move data to a device"""
    def __init__(self, dl, device):
        self.dl = dl
        self.device = device
        
    def __iter__(self):
        """Yield a batch of data after moving it to device"""
        for b in self.dl: 
            yield to_device(b, self.device)

    def __len__(self):
        """Number of batches"""
        return len(self.dl)

In [None]:
device = get_default_device()
device
#vemos que hay GPU disponible ("cuda")

Ahora pasamos los training y validation data loaders a la gpu para pasar automaticamente los batches de datos a la gpu, y con to_device se pasa el modelo a la gpu.

In [None]:
train_dl = DeviceDataLoader(train_dl, device)
val_dl = DeviceDataLoader(val_dl, device)
to_device(model, device);

# **TRAINING THE MODEL**

Vamos a definir 2 funciones: `fit` y `evaluate` para entrenar el modelo usando descenso de gradiente y evaluar su actuación en el validation set.

In [None]:
@torch.no_grad() #indica que mientras se ejecute la funcion evaluate no se compute ningún gradiente
def evaluate(model, val_loader):
    model.eval() #informa a pytorch de que estamos evaluando el modelo por lo que no habrá randomize
    outputs = [model.validation_step(batch) for batch in val_loader] #obtiene batches de imagenes del val_dl y los pasa a la validation_step function que devolvera la loss de la validation
    return model.validation_epoch_end(outputs) #calcula la media de las loss y devuelve un unico output

def fit(epochs, lr, model, train_loader, val_loader, opt_func=torch.optim.SGD): #se le pasa el numero de epochs y el optimizador que usaremos SGD (stocastic gradient descend).
    history = []
    optimizer = opt_func(model.parameters(), lr) #el optimizador toma los model.parameters que son los weights y biases de todas las capas y los va actualizando
    for epoch in range(epochs): #para cada epoch va a ver una fase de training y otra de validation
        # Training Phase 
        model.train() #informa a pytorch de que estamos entrenando el modelo
        train_losses = [] #se mantiene un seguimiento de las perdidas(losses)
        for batch in train_loader: #cogemos batches de imagenes del train_dl
            loss = model.training_step(batch) #esta funcion esta definida en ImageClassificationBase class y devuelve la perdida(loss) para el batch que se le pasa como input
            train_losses.append(loss) #para obtener al final la loss total del epoch
            loss.backward() #calcula los gradientes
            optimizer.step() #se aplica el decenso de gradiente con un optimizador
            optimizer.zero_grad() #pone a 0 los gradientes calculados en loss.backwards
        # Validation phase
        result = evaluate(model, val_loader) #llama a la funcion evaluate definida más arriba en este bloque y devuelve el validation loss y validation accuracy
        result['train_loss'] = torch.stack(train_losses).mean().item() #calcula la media del train_losses para el epoch entero
        model.epoch_end(epoch, result) #imprime el numero de epoch, el training loss, validation loss y validation accuracy
        history.append(result) #el resultado se añade al registro de resultados anteriores
    return history

In [None]:
model = to_device(CatsVSDogsCnnModel(), device) #actualizamos el modelo con el que se ha pasado a la GPU

In [None]:
evaluate(model, val_dl)

In [None]:
num_epochs = 20 #vamos a entrenar con 10 epochs
opt_func = torch.optim.Adam #usamos la función de optimizacion Adam
lr = 0.0001 #learning rate general

Entrenamos el modelo:

In [None]:
history = fit(num_epochs, lr, model, train_dl, val_dl, opt_func) #coge batches de imagenes del dataset y las pasa por el modelo, coge la salida, calcula gradientes, aplica SGD, cambiar los  weights y biases ligeramente para reducir la loss y repetir eso para todos los batches de cada epoch
#se puede ver que la máxima val_acc (accuracy) la alcanza con 9 epochs

In [None]:
for n_iter in range(num_epochs):
    writer.add_scalar('Loss/test', history[n_iter]['val_loss'], n_iter)
    writer.add_scalar('Accuracy/test', history[n_iter]['val_acc'], n_iter)
    writer.add_scalar('Loss/train', history[n_iter]['train_loss'], n_iter)

Graficar las validation set accuracies para ver como el modelo mejora con los distintos epochs:

In [None]:
def plot_accuracies(history):
    accuracies = [x['val_acc'] for x in history]
    plt.plot(accuracies, '-x')
    plt.xlabel('epoch')
    plt.ylabel('accuracy')
    plt.title('Accuracy vs. No. of epochs');

In [None]:
plot_accuracies(history) 
#se puede aumentar la accuracy aumentando el numero de concolutional layers o el numero de canales en cada concolutional layer.

Graficar las training losses y las validation losses para ver como el modelo mejora con los distintos epochs:

In [None]:
def plot_losses(history):
    train_losses = [x.get('train_loss') for x in history]
    val_losses = [x['val_loss'] for x in history]
    plt.plot(train_losses, '-bx')
    plt.plot(val_losses, '-rx')
    plt.xlabel('epoch')
    plt.ylabel('loss')
    plt.legend(['Training', 'Validation'])
    plt.title('Loss vs. No. of epochs');

In [None]:
plot_losses(history)
#a partir del epoch nº 9 el training_loss sigue disminuyendo pero el validation_loss vuelve a aumentar, se produce overfitting

# **TESTING WITH INDIVIDUAL IMAGES**

In [None]:
transform = transforms.Compose(
    [transforms.Resize((32,32)),
     transforms.ToTensor()])  #transforma todas las imagenes en el mismo tamaño de 128x128 pixeles

test_dataset = ImageFolder(data_dir+'/test', transform=transform)#creamos un dataset con la clase ImageFolder

Función auxiliar para hacer la predicción de una imagen:

In [None]:
def predict_image(img, model):
    # Convert to a batch of 1
    xb = to_device(img.unsqueeze(0), device)
    # Get predictions from model
    yb = model(xb)
    # Pick index with highest probability
    _, preds  = torch.max(yb, dim=1)
    # Retrieve the class label
    return dataset.classes[preds[0].item()]

Pruebas con algunas imágenes:

In [None]:
img, label = test_dataset[0]
plt.imshow(img.permute(1, 2, 0))
print('Label:', dataset.classes[label], ', Predicted:', predict_image(img, model))

In [None]:
img, label = test_dataset[2000]
plt.imshow(img.permute(1, 2, 0))
print('Label:', dataset.classes[label], ', Predicted:', predict_image(img, model))

Por ultimo, miramos la loss y accuracy generales del modelo sobre el test set. Estos valores deberían ser similares a los del validation set, si no, necesitaremos un mejor validation set que sea mas similar al test set

In [None]:
test_loader = DeviceDataLoader(DataLoader(test_dataset, batch_size*2), device)
result = evaluate(model, test_loader)
result

# **SAVING AND LOADING THE MODEL**

In [None]:
torch.save(model.state_dict(), 'catsVSdogs-cnn.pth') #guarda el modelo en ese archivo

In [None]:
model2 = to_device(CatsVSDogsCnnModel(), device) #crea un nuevo modelo 2 

In [None]:
model2.load_state_dict(torch.load('catsVSdogs-cnn.pth')) #carga el modelo 2 con el modelo que habiamos guardado en el archivo

<All keys matched successfully>

In [None]:
evaluate(model2, test_loader) #comprobamos que el modelo cargado tiene la misma accuracy que anteriormente

# **TENSORBOARD**

In [None]:
%tensorboard --logdir=runs