# **Atividade do módulo 3: Classificação do MNIST**


Agora que temos todo o poder do PyTorch à nossa disposição, podemos classificar um conjunto de dados mais concreto. Em particular, vamos construir um classificador para o conjunto de dados de dígitos manuscritos MNIST ([MNIST Handwritten Digits dataset](https://en.wikipedia.org/wiki/MNIST_database)). Este conjunto de dados contém dezenas de milhares de dígitos manuscritos de 0 a 9, sendo comumente usado para o desenvolvimento de algoritmos de aprendizagem de máquina. Nesta atividade, forneceremos um código básico de carregamento de dados para que você construa uma rede neural profunda treinada no conjunto de dados MNIST. Sinta-se à vontade para reutilizar o código que você escreveu ou viu em *notebooks* anteriores.

In [None]:
import torch
import torch.nn as nn
import torchvision.datasets
from torchvision import transforms
from torch.utils.data import DataLoader
from torch.utils.data.sampler import SubsetRandomSampler
import time, copy

# Configuração do dispositivo (treine nosso modelo na GPU, se disponível, pois é muito mais rápido)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

Primeiro, vamos carregar nosso conjunto de dados MNIST. O PyTorch fornece funções integradas para carregar conjuntos de dados de imagens populares, sendo o MNIST um deles.

In [None]:
# Essas transformações serão aplicadas em cada ponto de dados – neste exemplo, queremos transformar cada
# ponto de dados em um tipo de dado Tensor
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize([0.5], [0.5])])
mnist_train = torchvision.datasets.MNIST('', train=True, transform =transform, download=True)
# Vamos dividir o conjunto de dados de treinamento em treinamento e validação
mnist_train, mnist_val = torch.utils.data.random_split(mnist_train, [50000, 10000])
mnist_test = torchvision.datasets.MNIST('', train=False, transform = transform, download=True)


In [None]:
# Vamos criar os DataLoaders como antes, com um tamanho de lote de 100
batch_size = 100
dataloaders = {'train': DataLoader(mnist_train, batch_size=batch_size),
               'val': DataLoader(mnist_val, batch_size=batch_size),
               'test': DataLoader(mnist_test, batch_size=batch_size)}

dataset_sizes = {'train': len(mnist_train),
                 'val': len(mnist_val),
                 'test': len(mnist_test)}
print(f'dataset_sizes = {dataset_sizes}')

In [None]:
# Dica! No notebook "Introdução ao PyTorch", do módulo 3, a rede
# que criamos requer que os dados de entrada tenham a forma Nx1, em que N é o número
# de atributos. Atualmente, nosso conjunto de dados MNIST está na forma 28x28, pois são imagens. Use
# este trecho de código enquanto itera pelos pontos de dados em seu conjunto de dados para nivelá-los,
# para que tenham o tamanho 784x1 e possam ser usados com os modelos que projetamos anteriormente!

# Este loop somente itera pelos pontos de dados "train"
# No notebook anterior
phases = ["train", "val", "test"]
for phase in phases:
  for inputs, labels in dataloaders[phase]:
    # Isso nivela os lotes para o tamanho correto!
    inputs = inputs.view(inputs.shape[0],-1)

In [None]:
# INSERIR CÓDIGO AQUI

# modelo =

# perda e otimizador ("loss and optimizer") =
# critério ("criterion") =
# otimizador ("optimizer") =
# agendador ("scheduler") =
# Certifique-se de salvar as curvas de treinamento a medida que trabalha para visualização posterior
# model, training_curves = train_model(...)

In [None]:
# Funções utilitárias para plotar seus resultados!
def plot_training_curves(training_curves,
                         phases=['train', 'val', 'test'],
                         metrics=['loss','acc']):
    epochs = list(range(len(training_curves['train_loss'])))
    for metric in metrics:
        plt.figure()
        plt.title(f'Training curves - {metric}')
        for phase in phases:
            key = phase+'_'+metric
            if key in training_curves:
                plt.plot(epochs, training_curves[phase+'_'+metric])
        plt.xlabel('epoch')
        plt.legend(labels=phases)

def classify_predictions(model, device, dataloader):
    model.eval()   # Definir o modelo no modo de avaliação
    all_labels = torch.tensor([]).to(device)
    all_scores = torch.tensor([]).to(device)
    all_preds = torch.tensor([]).to(device)
    for inputs, labels in dataloader:
        # Importante! Precisamos nivelar cada ponto de dados
        inputs = inputs.view(inputs.shape[0], -1)
        inputs = inputs.to(device)
        labels = labels.to(device)
        outputs = torch.softmax(model(inputs),dim=1)
        _, preds = torch.max(outputs, 1)
        scores = outputs[:,1]
        all_labels = torch.cat((all_labels, labels), 0)
        all_scores = torch.cat((all_scores, scores), 0)
        all_preds = torch.cat((all_preds, preds), 0)
    return all_preds.detach().cpu(), all_labels.detach().cpu(), all_scores.detach().cpu()

def plot_cm(model, device, dataloaders, phase='test'):
    class_labels = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    preds, labels, scores = classify_predictions(model, device, dataloaders[phase])

    cm = metrics.confusion_matrix(labels, preds)
    disp = metrics.ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=class_labels)
    ax = disp.plot().ax_
    ax.set_title('Confusion Matrix -- counts')


In [None]:
plot_training_curves(training_curves, phases=['train', 'val', 'test'])

In [None]:
res = plot_cm(model, device, dataloaders, phase='test')