<a href="https://colab.research.google.com/github/AynaAraujo/Aprendendo_Redes_Neurais/blob/main/Treinando_Rede_Neural/Fun%C3%A7%C3%B5es_de_Perda.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Funções de Perda

O módulo ```nn``` e suas 1001 utilidades, também fornece as implementações das principais funções de perda. Então vamos primeiro importar o ```torch``` e o módulo ```nn``` <br>

In [None]:
import torch
from torch import nn

Antes de tudo, vamos conferir qual dispositivo de hardware está disponível para uso.

In [None]:
#Verificando se a GPU está disponível
if torch.cuda.is_available():
  device = torch.device('cuda')
else:
  device = torch.device('cpu')

print(device)

cuda


Vamos trabalhar com o dataset de classificação de vinhos.

https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_wine.html


In [None]:
#Para importar os datasets
from sklearn import datasets


wine = datasets.load_wine() #Carrega dataset de vinho
data = wine.data #Pega os dados do dataset
target = wine.target #Pega os rótulos do dataset

print(data.shape, target.shape) #Dimensão
print(wine.feature_names, wine.target_names) #Nomes

(178, 13) (178,)
['alcohol', 'malic_acid', 'ash', 'alcalinity_of_ash', 'magnesium', 'total_phenols', 'flavanoids', 'nonflavanoid_phenols', 'proanthocyanins', 'color_intensity', 'hue', 'od280/od315_of_diluted_wines', 'proline'] ['class_0' 'class_1' 'class_2']


In [None]:
target[-1] #é um número
data[-1] #Sequencia de caracteres

array([ 14.13,   4.1 ,   2.74,  24.5 ,  96.  ,   2.05,   0.76,   0.56,
         1.35,   9.2 ,   0.61,   1.6 , 560.  ])


Vamos instanciar um MLP com uma camada escondida e uma camada de saída. <br>

In [None]:
class WineClassifier(nn.Module):
  #Sempre deve ter as defs: init e foward

  def __init__(self, input_size, hidden_size, out_size):
    super(WineClassifier, self).__init__() #Inicializa a super classe

    #Arquitetura
    self.hidden  = nn.Linear(input_size, hidden_size)
    self.relu    = nn.ReLU()
    self.out     = nn.Linear(hidden_size, out_size)
    self.softmax = nn.Softmax() #Transforma a saída em probabilidades

  def forward(self, X):

    feature = self.relu(self.hidden(X)) #Ativação da camada intermediária
    output  = self.softmax(self.out(feature)) #Ativação output linear

    return output

input_size  = data.shape[1] #qtd de dados/features
hidden_size = 32 #hiperparâmetro definido pelo programador
out_size    = len(wine.target_names) #Classes de saída

net = WineClassifier(input_size, hidden_size, out_size).to(device) #cast na GPU

In [None]:
print(net)

WineClassifier(
  (hidden): Linear(in_features=13, out_features=32, bias=True)
  (relu): ReLU()
  (out): Linear(in_features=32, out_features=3, bias=True)
  (softmax): Softmax(dim=None)
)


## Classificação

O primeiro passo é instanciar a função de perda de sua escolha. Trata-se de um problema de classificação com 3 classes, nesse caso a Cross Entropy é a função recomendada, que no PyTorch recebe o nome de *CrossEntropyLoss*: https://pytorch.org/docs/stable/nn.html#crossentropyloss

**Assim como a rede, as entradas e os rótulos, a função de perda também deve ser carregada na GPU**


In [None]:
#Jogando função de entropia cruzada na GPU
criterion = nn.CrossEntropyLoss().to(device) # cast na GPU

Antes de aplicar a função de perda, vamos fazer o cast dos dados para tensores e extrair as predições ```y'``` da rede.

In [None]:
#Transformando dados em Tensores(matrizes)
Xtns = torch.from_numpy(data).float() #Como não usamos double tem que converter pra Float
Ytns = torch.from_numpy(target)

# Cast na GPU
Xtns = Xtns.to(device)
Ytns = Ytns.to(device)

print(Xtns.dtype, Ytns.dtype)

torch.float32 torch.int64


In [None]:
pred = net(Xtns)

print(pred.shape)
print(pred[0]) #Como não treinamos ainda, retorna valor aleatório

  return self._call_impl(*args, **kwargs)


torch.Size([178, 3])
tensor([0.0000e+00, 1.0000e+00, 3.4619e-38], device='cuda:0',
       grad_fn=<SelectBackward0>)


Confira as dimensões de ```y``` e ```y'```. Enquanto as predições estão em termos de probabilidades, os rótulos de classificação devem são valores inteiros referentes aos índices das classes.

In [None]:
print(pred.shape, Ytns.shape)

#Não tem problema o pred e o Ytns terem dimensões diferentes
print(pred[0].data, Ytns[0].data)

torch.Size([178, 3]) torch.Size([178])
tensor([0.0000e+00, 1.0000e+00, 3.4619e-38], device='cuda:0') tensor(0, device='cuda:0')


As funções de perda implementadas no PyTorch esperam o seguinte padrão de chamada:

```python
loss = criterion(prediction, target)
```

Vale lembrar que cada função de perda possui especificidades quanto às dimensões dos seus parâmetros. Para a Cross Entropy:
* prediction: ```(N, C)```
* target: ```(N,)```

In [None]:
#loss de 1 dado
loss = criterion(pred[0].unsqueeze(0), Ytns[0].unsqueeze(0))
print(loss)

#loss média para intervalo de dados
loss = criterion(pred[:30], Ytns[:30])
print(loss)


#loss média
loss = criterion(pred, Ytns)
print(loss)

tensor(1.5514, device='cuda:0', grad_fn=<NllLossBackward0>)
tensor(1.5514, device='cuda:0', grad_fn=<NllLossBackward0>)
tensor(1.1526, device='cuda:0', grad_fn=<NllLossBackward0>)


## Regressão


Vamos trabalhar com o dataset de Diabetes, cujo objetivo é prever a progressão da diabetes em um paciente.

https://scikit-learn.org/stable/datasets/index.html#diabetes-dataset

In [None]:
from sklearn import datasets

#Importando o dataset de diabetes
diabetes = datasets.load_diabetes()
data = diabetes.data
target = diabetes.target

print(data.shape, target.shape)

print(data[14])
print(target[14]) #Agora são valores Contínuos

(442, 10) (442,)
[ 4.53409833e-02 -4.46416365e-02 -2.56065715e-02 -1.25561242e-02
  1.76943802e-02 -6.12835791e-05  8.17748397e-02 -3.94933829e-02
 -3.19876395e-02 -7.56356220e-02]
118.0


Implementando o MLP

In [None]:
class WineClassifier(nn.Module):

  def __init__(self, input_size, hidden_size, out_size):
    super(WineClassifier, self).__init__()

    #Arquitetura
    self.hidden  = nn.Linear(input_size, hidden_size)
    self.relu    = nn.ReLU()
    self.out     = nn.Linear(hidden_size, out_size)
    self.softmax = nn.Softmax(dim=-1)

  def forward(self, X):

    feature = self.relu(self.hidden(X))
    output  = self.softmax(self.out(feature))

    return output

input_size  = data.shape[1]
hidden_size = 32
out_size    = 1  # qtd de vars que queremos fazer a regressão
                # 1 pois só queremos saber se a pessoa é diabética ou não

net = WineClassifier(input_size, hidden_size, out_size).to(device) #cast na GPU

Para solucionar problemas de regressão, as funções de perda correspondentes esperam que ambos o rótulo e a predição tenham **a mesma dimensionalidade**. Não se trata mais de um problema categórico.

Portanto, vamos simular um problema de regressão e aplicar a *MSELoss*<br>
Documentação: https://pytorch.org/docs/stable/nn.html#mseloss

In [None]:
#Critério de Regressão
criterion = nn.MSELoss().to(device) #Jogando na   GPU

# Cast na GPU
Xtns = torch.from_numpy(data).float().to(device)
Ytns = torch.from_numpy(target).float().to(device)

#PRED E RÓTULO PRECISA TER MSM DIMENSIONALIDADE
print(Xtns.shape, Ytns.shape)

torch.Size([442, 10]) torch.Size([442])


In [None]:
pred = net(Xtns)
print(pred.shape)
loss = criterion(pred.squeeze(), Ytns)
print(loss.data)

torch.Size([442, 1])
tensor(28771.2168, device='cuda:0')


In [None]:
criterion = nn.L1Loss().to(device)

pred = net(Xtns)

loss = criterion(pred.squeeze(), Ytns)
print(loss.data)

tensor(151.1335, device='cuda:0')


## Documentação
Veja a documentação para consultar a lista de todas as funções de perda implementadas no PyTorch: <br>
https://pytorch.org/docs/stable/nn.html#loss-functions