# P2 

In [None]:
# se importan las librerías y funciones necesarias

import torch
import torch.nn as nn
import torchvision.datasets as datasets
import torch.nn.functional as F

from torchvision import models
from torch import optim
from sklearn.metrics import f1_score

In [None]:
# se crea una clase con dos capas de convolución
# la primera depthwise
# la segunda pointwise

class DWSepConv2d(torch.nn.Module):
    
    def __init__(self, in_channels, out_channels, ker, padd, bias=True):
        super().__init__()
        self.depthwise = nn.Conv2d(in_channels, in_channels, kernel_size=ker, stride=1, padding=padd, bias=bias)
        self.pointwise = nn.Conv2d(in_channels, out_channels, kernel_size= 1, stride=1, bias=bias)
        
    def forward(self, xb):
        xb = self.depthwise(xb)
        xb = F.relu(self.pointwise(xb))
        return xb

In [None]:
# se crea la red neuronal con las capas descritas en el enunciado

class VGG16DWSep(torch.nn.Module):
    
    def __init__(self):
        super().__init__()
        
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1)
        self.conv2 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1)
        
        #pooling
        self.conv3 = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
        
        self.conv4 = DWSepConv2d(64, 128, ker=3, padd=1)
        self.conv5 = DWSepConv2d(128, 128, ker=3, padd=1)
        
        #pooling
        self.conv6 = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
        
        self.conv7 = DWSepConv2d(128, 256, ker=3, padd=1)
        
        self.conv8 = nn.BatchNorm2d(256)
        
        self.conv9 = DWSepConv2d(256, 256, ker=3, padd=1)
        
        self.conv10 = nn.BatchNorm2d(256)
        
        self.conv11 = DWSepConv2d(256, 256, ker=3, padd=1)
        
        #pooling
        self.conv12 = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
        
        self.conv13 = DWSepConv2d(256, 512, ker=3, padd=1)
        
        self.conv14 = nn.BatchNorm2d(512)
        
        self.conv15 = DWSepConv2d(512, 512, ker=3, padd=1)
        
        self.conv16 = nn.BatchNorm2d(512)
        
        self.conv17 = DWSepConv2d(512, 512, ker=3, padd=1)
        
        self.conv18 = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
        
        #flattening
        self.conv19 = nn.Flatten()
        
        self.conv20 = nn.Linear(512*49*4, 1024)
        
        self.conv21 = nn.Dropout(0.7)
        
        self.conv22 = nn.Linear(1024, 512)
        
        self.conv23 = nn.Dropout(0.5)
        
        self.conv24 = nn.Linear(512, 2)
        
    
    def forward(self, xb):
        
        xb = xb.view(-1, 3, 224, 224)
        
        xb = F.relu(self.conv1(xb.float()))
        
        xb = F.relu(self.conv2(xb))
        
        xb = self.conv3(xb)
        
        xb = F.relu(self.conv4(xb))
        
        xb = F.relu(self.conv5(xb))
        
        xb = self.conv6(xb)
        
        xb = F.relu(self.conv7(xb))
        
        xb = self.conv8(xb)
        
        xb = F.relu(self.conv9(xb))
        
        xb = self.conv10(xb)
        
        xb = F.relu(self.conv11(xb))
        
        xb = self.conv12(xb)
        
        xb = F.relu(self.conv13(xb))
        
        xb = self.conv14(xb)
        
        xb = F.relu(self.conv15(xb))
        
        xb = self.conv16(xb)
        
        xb = F.relu(self.conv17(xb))
                
        xb = self.conv18(xb)
                
        xb = self.conv19(xb)
                
        xb = F.relu(self.conv20(xb))
        
        xb = self.conv21(xb)
        
        xb = F.relu(self.conv22(xb))
        
        xb = self.conv23(xb)
        
        xb = self.conv24(xb)
        
        return xb

In [None]:
# Creamos una instancia de un modelo existente para extraer los pesos de las primeras dos capas de convolución

VGG16 = models.vgg16(pretrained=True, progress=True)

# Se guardan los pesos de la primera capa
pesos1 = VGG16.features[0].weight

# Se guardan los pesos de la segunda capa
pesos2 = VGG16.features[2].weight

In [None]:
# transferencia de pesos

#inicializamos la red
model = VGG16DWSep()

model.conv1.weight = pesos1
#dejamos constante durante el entrenamiento
model.conv1.requires_grad = False

model.conv2.weight = pesos2
model.conv2.requires_grad = False

In [None]:
# Se crea la clase EarlyStopping para dejar de entrenar un modelo en caso que 
# ya no siga mejorando

class EarlyStopping():
    
    def __init__(self, modo='min', paciencia=5, porcentaje=False, tol=0):
        self.modo = modo
        self.paciencia = paciencia
        self.porcentaje = porcentaje
        self.tol = tol
        self.best = None # guardará la mejor metrica
        self.stopstep = 0 # contador que nos dirá cuando parar en el método deberia_parar
        
    def mejor(self, metrica_validacion):
        
        if self.best == None:
            self.best = metrica_validacion
            return True
        
        elif self.porcentaje:
            if self.modo == 'min':
                if metrica_validacion < self.best*(1-self.tol):
                    self.best = metrica_validacion
                    self.stopstep = 0 
                    return True
                else:
                    # es peor y acumula un paso en el stopstep
                    self.stopstep += 1
                    return False
            else:
                if metrica_validacion > self.best*(1+self.tol):
                    self.best = metrica_validacion
                    self.stopstep = 0
                    return True
                else: 
                    self.stopstep += 1
                    return False
                
        else:
            if self.modo == 'min':
                if metrica_validacion < self.best - self.tol:
                    self.best = metrica_validacion
                    self.stopstep = 0
                    return True
                else:
                    self.stopstep += 1
                    return False
            else:
                if metrica_validacion > self.best + self.tol:
                    self.best = metrica_validacion
                    self.stopstep = 0
                    return True
                else:
                    self.stopstep += 1
                    return False

    def deberia_parar(self, metrica_validacion):
        if self.mejor(metrica_validacion):
            return False # si es mejor no tiene que parar
        elif self.stopstep < self.paciencia:
            return False # si todavia no han pasado las epocas que tiene paciencia, no para
        else:
            return True # tiene que parar en otro caso
        
    
    

In [None]:
# Vemos si está disponible la GPU

torch.cuda.is_available()

In [None]:
from sklearn.metrics import f1_score
from sklearn.preprocessing import MultiLabelBinarizer

# Entrenamiento de la red

# número de épocas
num_epochs = 20

# inicializamos una instancia de EarlyStopping
es = EarlyStopping(modo = 'max')

#listas para reportar resultados
accuracy = []
f1_score_list = []
losses = []

# se cambia a la GPU
model.cuda()

opt = optim.Adam(model.parameters(), lr=1e-4, weight_decay=1e-5)
loss_func = F.cross_entropy

for epoch in range(num_epochs):

    labels_list = []
    outputs_list = []  
    
    #ciclo de entrenamiento
    for i, (images, labels) in enumerate(loader_data_train):

        outputs = model(images.cuda())
        
        loss = loss_func(outputs.cuda(), labels.long().cuda())
        losses.append(loss.item())

        loss.backward()
        opt.step()
        opt.zero_grad()
    
    
    #ciclo de validacion
    right = 0
    total = 0
    for i, (images, labels) in enumerate(loader_data_valid):
        outputs = model(images.cuda()) 
        right += (torch.argmax(outputs, dim=1) == labels.cuda()).float().sum() 
        total += len(labels)
        pred = torch.argmax(outputs, dim=1).cpu().numpy()

        outputs_list.append(pred)
        labels_list.append(labels.data.to('cpu').numpy())        
    
    metrica_validacion = 100 * right / total
    metrica_validacion = metrica_validacion.item()
    
    accuracy.append(metrica_validacion)

    tru = MultiLabelBinarizer().fit_transform(labels_list)
    prd = MultiLabelBinarizer().fit_transform(outputs_list)

    f = f1_score(tru, prd, average='samples')
    f1_score_list.append(f)

    print('Epoca:', epoch+1,',', 'metrica:', metrica_validacion)
    
    if es.deberia_parar(metrica_validacion):
        #se cumple el criterio de early stop
        break

In [None]:
accuracy

In [None]:
f1_score