<a href="https://colab.research.google.com/github/ifmg-betim/2024.1_AUT.068_RNA/blob/main/TP03_torch.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# TP03 - [`seu nome e (RA)`]

Neste TP você implementará uma rede MLP usando biblioteca PyTorch para um problema de classificação de imagens.

**Instruções:**
- Recomendo que esse TP seja executado no Google Colab!
- Não apague os comentários existentes, mas você pode adicionar outros comentários!

**Objetivos**
- Implementar uma rede MLP para classificação de imagens
- Usar biblioteca Pytorch para implementação

## Escreva o seu RA na variável abaixo
Atribua o número do seu RA, sem os zeros à esquerda, na variável `RA` abaixo.

In [None]:
### SEU CÓDIGO COMEÇA AQUI ### (≈ 1 linha de código)
RA = None
### FIM DO CÓDIGO ###

## Bibliotecas

Você usará a biblioteca PyTorch neste trabalho.

<mark>**Faça**</mark>: Rode o código abaixo para importar o PyTorch e verificar sua versão. Se não rodar, você pode precisar instalar, acesse: https://pytorch.org/get-started/locally/

In [None]:
import torch
print(torch.__version__)

## Dados

### Importando os dados

Você trabalhará com a base de dados MNIST, que contém 70 mil imagens, em escala de cinza, de dígitos manuscritos (0-9) e seus respectivos rótulos. Esta base de dados pode ser acessada via Pytorch (`torchvision.dataset`) e é dividida em 60.000 amostras de treinamento e 10.000 amostras de teste.

<mark>**Faça**</mark>: Rode o código abaixo para importar os dados. No espaço abaixo, use a função `random_split` para segregar os dados contidos em `mnist_data` em 55.000 amostras de treinamento e 5.000 de validação.

In [None]:
import os, time, numpy as np, matplotlib.pyplot as plt
import torchvision
from torchvision import transforms
from torchvision.datasets import MNIST
from torch.utils.data import random_split

# para normalização dos dados
mnist_transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,)) ])

# Carrega dados de treinamento / validação
mnist_data = MNIST(os.getcwd(), train=True, download=True, transform=mnist_transform)

# Carrega dados de teste
mnist_test = MNIST(os.getcwd(), train=False, download=True, transform=mnist_transform)

############################################################
### SEU CÓDIGO COMEÇA AQUI ### (≈ 1 linha de código)
None
### FIM DO CÓDIGO ###
############################################################

# Mostrando uma amostra de imagem de entrada
image, label = mnist_data.__getitem__(RA%60000)
plt.imshow(  image.view(28,28).numpy(), cmap = 'gray_r' )
plt.axis('off')
plt.show()

### Manipulando os dados de entrada e saída

Para facilitar a manipulação dos dados, são criados objetos `DataLoaders`. Esses objetos podem ser criados usando a função `DataLoader` que já foi importada pelo código abaixo. Note o parâmetro `batch_size` da função, em que deve ser informado o tamanho do mini-batch. Esse parâmetro será útil daqui a pouco no treinamento, mas, aqui, por enquanto, coloque o valor `64` para o tamanho do mini-batch.

<mark>**Faça**</mark>: Use a função `DataLoader` para gerar objetos que façam a manipulação dos dados. Usando a função `torchvision.utils.make_grid`, mostre imagens de 1 mini-batch dos dados de treinamento.

In [None]:
from torch.utils.data import DataLoader

############################################################
### SEU CÓDIGO COMEÇA AQUI ### (≈ 20 linhas de código)

# Data loaders
n_batch = 64
loader_trn = None
loader_val = None
loader_tst = None

# Carrega 1 batelada de dados de treinamento
images, labels = iter(loader_trn).__next__()

# Constrói um grid com 1 batelada de imagens
image_grid = None

# Mostra imagem
None

### FIM DO CÓDIGO ###
############################################################

### Balanceamento dos dados
<mark>**Faça**</mark>: para cada conjunto de dados (treinamento, validação e teste), verifique a quantidade de amostras de cada "rótulo". Use o método `.bincount()` para contar as amostras dos `targets` nos dados. Faça um gráfico mostrando a quantidade de dados de cada amostra (dígitos de 0 a 9) nos dados de treinamento, validação e teste.

In [None]:
############################################################
### SEU CÓDIGO COMEÇA AQUI ### (≈ 14 linhas de código)
None
### FIM DO CÓDIGO ###
############################################################

## Modelo
Agora você vai criar uma classe para implementar um modelo de rede neural de 2 camadas. A classe deve se basear na classe `nn.Module`, ou seja, você criará uma classe "filha" da `nn.Module`. Para fazer isso, defina o nome da classe como `class nome_da_classe(nn.Module)` e escreva o comando `super(nome_da_classe, self).__init__()` no método `__init__` da classe que será criada. Assim, a classe criada usará como base a `nn.Module`, herdando todos os métodos já definidos na biblioteca do PyTorch.

<mark>**Faça**</mark>: crie uma classe com nome `nn_2camadas`, que implementa um modelo de 2 camadas. A inicialização da classe deve ter os parâmetros de número de entradas (`dim_in`), número de neurônios na camada escondida (`dim_hidden`) e número de saídas (`dim_out`). Escolha adequadamente as funções de ativação. A classe deve implementar ainda o método `forward` que calcula a saída da rede neural. Após criar a classe, rode o código abaixo para verificar o funcionamento. Confira a dimensão e características do vetor de saída `yh`.

In [None]:
import torch.nn as nn

############################################################
### SEU CÓDIGO COMEÇA AQUI ### (≈ 20 linhas de código)

# definição da classe do modelo de 2 camadas (nn_2camadas)
None

### FIM DO CÓDIGO ###
############################################################

# parâmetros da rede
dim_in, dim_hidden, dim_out = 28*28, 10, 10

# instancia modelo
modelo = nn_2camadas(dim_in, dim_hidden, dim_out)

# teste inicial do modelo
images, labels = iter(loader_tst).__next__()
yh = modelo(images)

print(yh.shape) # yh.shape => [#samples, #classes]
print(yh[0,:]) # ==> yh da primeira amostra

### Hardware usado na execução do código

O código abaixo verifica se há GPUs (CUDA) disponíveis para rodar o código. Caso não haja, o código é executado na CPU mesmo. Note que a informação do hardware de execução (CPU ou GPU) fica armazenada na variável `device`.

<mark>**Faça**</mark>: rode o código abaixo e veja qual hardware disponível para rodar o código.

In [None]:
cuda = torch.cuda.is_available()
device = torch.device("cuda:0" if cuda else "cpu")
print(device)

### Treinamento

Para implementar o treinamento, você deve:
- definir o conjunto de dados e tamanho do mini-batch, usando `DataLoader` (mesmo código usado anteriormente)
- definir o modelo (instanciar a classe passando os parâmetros adequados)
- definir parâmetros de otimização, estabelecendo uma "função perda" e um otimizador (`optim`)
- colocar o modelo em modo "treinamento" usando `modelo.train()` (para colocar em modo "teste", use `modelo.eval()`)
- fazer laço de otimização

<mark>**Faça**</mark>: implemente o treinamento da rede. Escolha livremente os hiperparâmetros.

In [None]:
# Importa otimizador
import torch.optim as optim

############################################################
### SEU CÓDIGO COMEÇA AQUI ### (≈ 60 linhas de código)

# DADOS ==> Tamanho do batch
n_batch = None
loader_trn = None
loader_val = None
loader_tst = None

# MODELO ==> instancia modelo
None

# OTIMIZAÇÃO ==> Função de perda
lossFun = None

# ==> Otimizador
optimizer = None

# TREINAMENTO ==> Treinamento
tic = time.time()
nEpoch = None

#laço de treinamento
None

### FIM DO CÓDIGO ###
############################################################

toc = time.time()
print("Tempo gasto: %.2f min"%((toc-tic)/60))

### Desempenho
<mark>**Faça**</mark>: mostre um gráfico com o desempenho nos dados de treinamento, de validação e de teste.

In [None]:
############################################################
### SEU CÓDIGO COMEÇA AQUI ###
None
### FIM DO CÓDIGO ###
############################################################

### Imagens que falharam
<mark>**Faça**</mark>: mostre algumas imagens que não foram classificadas corretamente.

In [None]:
############################################################
### SEU CÓDIGO COMEÇA AQUI ###
None
### FIM DO CÓDIGO ###
############################################################

### Matriz de Confusão
<mark>**Faça**</mark>: faça a matriz de confusão da rede implementada, para os dados de teste. Use a biblioteca `sklearn.metrics` e `seaborn`.

In [None]:
############################################################
### SEU CÓDIGO COMEÇA AQUI ###
None
### FIM DO CÓDIGO ###
############################################################

## AVALIE SEU APRENDIZADO

Após o desenvolvimento desta atividade, espera-se que você seja capaz de
- utilizar funcionalidades da biblioteca Pytorch para manipular dados
- implementar sistemas de IA usando a biblioteca Pytorch
- compreender as principais etapas para implementação de um sistema de IA