In [None]:
%matplotlib inline

In [None]:
import torch
from torch import nn
from torch import optim
import torchvision
from matplotlib import pyplot as plt
from torchvision import transforms
from torchvision import datasets

#### Hiperparâmetros que você pode definir

In [None]:
batch_size = 16
device_name = 'cpu'
nb_epochs = 3
log_interval = 500
lr = 1e-3

### O código da célula abaixo contém funções para efetuar a carga dos dados

In [None]:
def get_loaders(batch_size):
    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ])

    train_loader = torch.utils.data.DataLoader(
        dataset=datasets.MNIST(
            root='../data', 
            train=True, 
            download=True,
            transform=transform,
        ),
        batch_size=batch_size, 
        shuffle=True
    )

    test_loader = torch.utils.data.DataLoader(
        dataset=datasets.MNIST(
            root='../data', 
            train=False, 
            download=True,
            transform=transform,
        ),
        batch_size=batch_size, 
        shuffle=True
    )
    return train_loader, test_loader

### Conferência dos dados

In [None]:
train_loader, test_loader = get_loaders(batch_size=batch_size)

In [None]:
print(
    'Train size: ', 
    train_loader.dataset.train_data.shape, 
    train_loader.dataset.train_labels.shape
)
print(
    'Test size : ', 
    test_loader.dataset.test_data.shape, 
    test_loader.dataset.test_labels.shape
)

In [None]:
fig, axs = plt.subplots(1, 5)
for i, ax in enumerate(axs):
    ax.imshow(train_loader.dataset.train_data[i], cmap='gray')
    ax.set_title(train_loader.dataset.train_labels[i].item())
    ax.set_xticks([])
    ax.set_yticks([])
plt.show()

In [None]:
instance = next(iter(train_loader))
print('Instance Example: ', instance[0].shape, instance[1].shape)

In [None]:
device = torch.device(device_name)

## Seu trabalho começa aqui:

### 1. Implemente aqui seu classificador linear   

Seu classificador linear deve ser capaz de classificar as imagens do MNIST. Lembre-se que um classificador linear não consegue processar tensores ou matrizes (imagem do MNIST é 28 x 28 x 1)

In [None]:
class LinearClassifier(nn.Module):
    def __init__(self):
        super(LinearClassifier, self).__init__()
        # Crie os modulos 
        
    def forward(self, x):
        # Implemente o forward 
        return out

### 1.1 Verifique se a saída do seu modelo está correta

In [None]:
dummy_input = torch.zeros(5, 1, 28, 28)

In [None]:
# Instancia o modelo e inicializa os pesos
model = LinearClassifier().to(device)

### 1.2 Implemente uma função para treinar o modelo

In [None]:
def train(model, lr, momentum):
    # TODO: 
    # - sample batch
    # - zero grad
    # - forward pass
    # - loss computation
    # - backward pass
    # - weight update
    return model

### 1.3 Implemente uma função para testar o modelo

In [None]:
def test(model, loader):
    # TODO: 
    # - sample test batch
    # - forward pass
    # - compare predicted and target
    # - compute and return accuracy
    return accuracy

### 1.4 Treine o seu classificador linear

In [None]:
model = LinearClassifier().to(device)

trained = train(model)
acc = test(trained, test_loader)
print('Final acc: {:.2f}%'.format(acc))

### 1.5 Visualize os pesos aprendidos durante o treino [opcional durante a aula]

In [None]:
# Você tem que plotar -> model.parameters()

### 2. Atualize seu classificador linear para conter duas camadas

In [None]:
class TwoLayer(nn.Module):
    def __init__(self):
        super(TwoLayer, self).__init__()
        # Defina os módulos aqui
        
    def forward(self, x):   
        # Implemente o forward 
        return None

In [None]:
model = TwoLayer().to(device)
print(model)

In [None]:
trained = train(model)
acc = test(trained, test_loader)
print('Final acc: {:.2f}%'.format(acc))

### 3. Atualize seu classificador de 2 camadas para utilizar o Container nn.Sequential


In [None]:
class TwoLayerSeq(nn.Module):
    def __init__(self,):
        super(TwoLayerSeq, self).__init__()
        # Defina os módulos 
        
    def forward(self, x):
        # Implemente o forward
        return out

model = TwoLayerSeq()
print(model)

In [None]:
model = TwoLayerSeq(device=device).to(device)

In [None]:
trained = train(model)
acc = test(trained, test_loader)
print('Final acc: {:.2f}%'.format(acc))

### 4. Implemente um classificador que aceite n camadas, cada camada deve conter: m neurônios,  uma função de ativação e uma fração de dropout 


In [None]:
class Classifier(nn.Module):
    def __init__(self, n, m, activation):
        super(Classifier, self).__init__()
        # Defina os módulos 
        
    def forward(self, x):
        # Implemente o forward
        return out

model = Classifier()
print(model)

In [None]:
trained = train(model)
acc = test(trained, test_loader)

print('Final acc: {:.2f}%'.format(acc))

### 5. Atualize o código acima de forma que cada camada seja implementada em um nn.Module separado do Classifier

In [None]:
class Layer(nn.Module):
    def __init__(self, n, m, activation):
        super(Layer, self).__init__()
        # Defina os módulos 
        
    def forward(self, x):
        # Implemente o forward
        return out

In [None]:
class Classifier(nn.Module):
    def __init__(self, n, m, activation):
        super(Classifier, self).__init__()
        # Defina os módulos aqui utilizando a classe Layer
        
    def forward(self, x):
        # Implemente o forward
        return out

In [None]:
trained = train(model)
acc = test(trained, test_loader)
print('Final acc: {:.2f}%'.format(acc))

### 6. Salve seu melhor modelo em disco
* Dica: utilizar os métodos torch.load() e model.state_dict()

In [None]:
def save_model(path, model):
    # TODO:
    pass

### 7. Carregue o modelo salvo e avalie novamente sua acurácia

In [None]:
def load_model(path, model):
    # TODO:
    return model