#Introdução à inteligência artificial

## Exercício 1

### Classificação de Fashion-MNIST

Agora é sua vez de construir e treinar uma rede neural. Você usará o [conjunto de dados Fashion-MNIST](https://github.com/zalandoresearch/fashion-mnist), um substituto para o conjunto de dados MNIST. Na verdade, o MNIST é bastante trivial com redes neurais, onde você pode obter facilmente uma precisão superior a 97%. Fashion-MNIST é um conjunto de imagens de roupas em escala de cinza de 28x28. É mais complexo que o MNIST, portanto, é uma melhor representação do desempenho real da sua rede e uma melhor representação dos conjuntos de dados que você usará no mundo real.

<div align=center>
<img src = 'https://raw.githubusercontent.com/zalandoresearch/fashion-mnist/master/doc/img/fashion-mnist-sprite.png' width = 500px>
</div>
Neste notebook, você criará sua própria rede neural. Na maioria das vezes, você pode copiar e colar o código das aulas anteriores, mas não aprenderia. É importante que você escreva o código você mesmo e faça com que ele funcione. Sinta-se à vontade para consultar os blocos de anotações anteriores enquanto trabalha com esse exercício.

Primeiro, vamos carregar o conjunto de dados através do 'torchvision'.

In [0]:
import torch
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
import numpy as np

# Defina uma transformação para normalizar os dados
transform = transforms.Compose([
transforms.ToTensor(), transforms.Normalize([0.5], [0.5])])

# Faça o download e carregue os dados de treinamento
trainset = datasets.FashionMNIST('~/.pytorch/F_MNIST_data/', download=True, train=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

# Faça o download e carregue os dados de teste
testset = datasets.FashionMNIST('~/.pytorch/F_MNIST_data/', download=True, train=False, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=True)

Aqui podemos ver uma das imagens.

In [0]:
def imshow(image, ax=None, title=None, normalize=True):
    """Imshow para Tensor."""
    if ax is None:
        fig, ax = plt.subplots()
    image = image.numpy().transpose((1, 2, 0))

    if normalize:
        mean = np.array([0.485, 0.456, 0.406])
        std = np.array([0.229, 0.224, 0.225])
        image = std * image + mean
        image = np.clip(image, 0, 1)

    ax.imshow(image)
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    ax.spines['left'].set_visible(False)
    ax.spines['bottom'].set_visible(False)
    ax.tick_params(axis='both', length=0)
    ax.set_xticklabels('')
    ax.set_yticklabels('')

    return ax

image, label = next(iter(trainloader))
imshow(image[0,:]);

### Construindo a rede

Aqui você deve definir sua rede. Assim como no MNIST, cada imagem tem 28x28, totalizando 784 pixels e 10 classes. Você deve incluir pelo menos uma camada oculta. Sugerimos que você use as ativações ReLU para as camadas e retorne os logits ou log-softmax da passagem direta. Cabe a você quantas camadas você adiciona e o tamanho dessas camadas.

Documentação: [nn.Linear](https://pytorch.org/docs/stable/nn.html#linear), [nn.ReLU](https://pytorch.org/docs/stable/nn.html#relu), [nn.Sigmoid](https://pytorch.org/docs/stable/nn.html#sigmoid), [nn.Tanh](https://pytorch.org/docs/stable/nn.html#tanh), [nn.SoftMax](https://pytorch.org/docs/stable/nn.html#softmax), [nn.NLLLoss](https://pytorch.org/docs/stable/nn.html#nllloss), [nn.CrossEntropyLoss](https://pytorch.org/docs/stable/nn.html#crossentropyloss)

In [0]:
from torch import nn

# TODO: Defina a arquitetura da sua rede usando nn.Sequential
model = None

### Treine a rede

Agora você deve criar sua rede e treiná-la. Primeiro, você deve definir [o critério](http://pytorch.org/docs/master/nn.html#loss-functions) (algo como `nn.CrossEntropyLoss`) e [o otimizador](http://pytorch.org/docs/master/optim.html) (normalmente `optim.SGD` ou `optim.Adam`).

Em seguida, escreva o código de treinamento. Lembre-se de que o passe de treinamento é um processo bastante direto:

* Faça um "passe pra frente" através da rede para obter os logits
* Use os logits para calcular a perda
* Execute um retrocesso na rede com `loss.backward()` para calcular os gradientes
* Dê um passo com o otimizador para atualizar os pesos

Ajustando os hiperparâmetros (unidades ocultas, taxa de aprendizado, etc.), você poderá obter a perda de treinamento abaixo de 0,4.

In [0]:
# TODO: Crie a rede, defina o critério e o otimizador
from torch import optim

criterion = None
optimizer = None

In [0]:
# TODO: Treine sua rede aqui
epochs = 5
for e in range(epochs):
    running_loss = 0
    for images, labels in trainloader:
        # "Achate" as imagens para um vetor de 784 posições
        images = images.view(images.shape[0], -1)
    
        # TODO: Treinamento

        # Limpe o gradiente do otimizador
        # Faça um passe pra frente usando o modelo e as imagens, obtendo as probabilidades log
        # Use o critério com as probabilidades e os 'labels, obtendo a perda "loss"
        # Realize um "passe pra trás" na perda
        # Dê um passo no otimizador
        
        running_loss += loss.item()
    else:
        print(f"Training loss: {running_loss/len(trainloader)}")

In [0]:
%matplotlib inline
%config InlineBackend.figure_format = 'retina'

# Função auxiliar para plotar a imagem
def view_classify(img, ps, version="MNIST"):
    ps = ps.data.numpy().squeeze()

    fig, (ax1, ax2) = plt.subplots(figsize=(6,9), ncols=2)
    ax1.imshow(img.resize_(1, 28, 28).numpy().squeeze())
    ax1.axis('off')
    ax2.barh(np.arange(10), ps)
    ax2.set_aspect(0.1)
    ax2.set_yticks(np.arange(10))
    if version == "MNIST":
        ax2.set_yticklabels(np.arange(10))
    elif version == "Fashion":
        ax2.set_yticklabels(['Camiseta',
                             'Calças',
                             'Pullover',
                             'Vestido',
                             'Casaco',
                             'Sandália',
                             'Camisa',
                             'Tênis',
                             'Bolsa',
                             'Bota no tornozelo'], size='small');
    ax2.set_title('Probabilidade de classe')
    ax2.set_xlim(0, 1.1)

# Teste sua rede
dataiter = iter(testloader)
images, labels = dataiter.next()
img = images[0]

# Converta a imagem 2D para um vetor 1D com 1 linha 
img = img.view(1,784)

# TODO: Calculate the class probabilities (softmax) for img
with torch.no_grad():
    logps = model(img)
ps =  torch.exp(logps)

# Plota o resultado
view_classify(img.resize_(1, 28, 28), ps, version='Fashion')