# <font color='blue'>Data Science Academy</font>
# <font color='blue'>Deep Learning Para Aplicações de IA com PyTorch e Lightning</font>

## <font color='blue'>Lab 1</font>
## <font color='blue'>Anatomia de Uma Rede Neural Artificial com PyTorch e Lightning</font>

![title](imagens/Lab1.png)

## Instalando e Carregando os Pacotes

In [None]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python Usada Neste Jupyter Notebook:', python_version())

In [None]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# !pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

# Instala o pacote watermark. 
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
!pip install -q -U watermark

In [None]:
!pip install torch==1.13.0+cu116 --extra-index-url https://download.pytorch.org/whl/cu116

In [None]:
!pip install -q pytorch-lightning==1.8.3

In [None]:
# Imports
import gc
import types
import pkg_resources
import torch
import pytorch_lightning as pl
from torch import nn, optim
from torch.autograd import Variable
from torch.utils.data import DataLoader
from pytorch_lightning.callbacks import ModelCheckpoint
#from pytorch_lightning.utilities.types import TRAIN_DATALOADERS
import warnings
warnings.filterwarnings("ignore")

In [None]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Data Science Academy" --iversions

## Verificando o Ambiente de Desenvolvimento

In [None]:
# Verificando o dispositivo
processing_device = "cuda" if torch.cuda.is_available() else "cpu"

In [None]:
print(processing_device)

In [None]:
# Verificando se GPU pode ser usada (isso depende da plataforma CUDA estar instalada)
torch_aval = torch.cuda.is_available()

In [None]:
print(torch_aval)

In [None]:
# Labels para o relatório de verificação
lable_1 = 'Visão Geral do Ambiente'
lable_2 = 'Se NVIDIA-SMI não for encontrado, então CUDA não está disponível'
lable_3 = 'Fim da Checagem'

In [None]:
# Função para verificar o que está importado nesta sessão
def get_imports():

    for name, val in globals().items():
        if isinstance(val, types.ModuleType):
            name = val.__name__.split(".")[0]

        elif isinstance(val, type):            
            name = val.__module__.split(".")[0]

        poorly_named_packages = {"PIL": "Pillow", "sklearn": "scikit-learn"}

        if name in poorly_named_packages.keys():
            name = poorly_named_packages[name]

        yield name

In [None]:
# Imports nesta sessão
imports = list(set(get_imports()))

In [None]:
print(imports)

In [None]:
# Loop para verificar os requerimentos
requirements = []
for m in pkg_resources.working_set:
    if m.project_name in imports and m.project_name!="pip":
        requirements.append((m.project_name, m.version))

In [None]:
print(requirements)

In [None]:
# Pasta com os dados (quando necessário)
pasta_dados = r'dados'

In [None]:
print(f'{lable_1:-^100}')
print()
print(f"Pasta de Dados: ", pasta_dados)
print(f"Versões dos Pacotes Requeridos: ", requirements)
print(f"Dispositivo Que Será Usado Para Treinar o Modelo: ", processing_device)
print(f"CUDA Está Disponível? ", torch_aval)
print("Versão do PyTorch: ", torch.__version__)
print("Versão do Lightning: ", pl.__version__)
print()
print(f'{lable_2:-^100}')
!nvidia-smi
gc.collect()
print()
print(f"Limpando a Memória da GPU (se disponível): ", torch.cuda.empty_cache())
print(f'{lable_3:-^100}')

> Se CUDA estiver instalado, a saída do comando nvidia-smi seria parecida com esta:

![title](imagens/nvidia-smi.png)

> Abaixo o relatório completo em uma única célula:

In [None]:
# Relatório completo

# Verificando o dispositivo
processing_device = "cuda" if torch.cuda.is_available() else "cpu"

# Verificando se GPU pode ser usada (isso depende da plataforma CUDA estar instalada)
torch_aval = torch.cuda.is_available()

# Labels para o relatório de verificação
lable_1 = 'Visão Geral do Ambiente'
lable_2 = 'Se NVIDIA-SMI não for encontrado, então CUDA não está disponível'
lable_3 = 'Fim da Checagem'

# Função para verificar o que está importado nesta sessão
def get_imports():

    for name, val in globals().items():
        if isinstance(val, types.ModuleType):
            name = val.__name__.split(".")[0]

        elif isinstance(val, type):            
            name = val.__module__.split(".")[0]

        poorly_named_packages = {"PIL": "Pillow", "sklearn": "scikit-learn"}

        if name in poorly_named_packages.keys():
            name = poorly_named_packages[name]

        yield name

# Imports nesta sessão
imports = list(set(get_imports()))

# Loop para verificar os requerimentos
requirements = []
for m in pkg_resources.working_set:
    if m.project_name in imports and m.project_name!="pip":
        requirements.append((m.project_name, m.version))
        
# Pasta com os dados (quando necessário)
pasta_dados = r'dados'

print(f'{lable_1:-^100}')
print()
print(f"Pasta de Dados: ", pasta_dados)
print(f"Versões dos Pacotes Requeridos: ", requirements)
print(f"Dispositivo Que Será Usado Para Treinar o Modelo: ", processing_device)
print(f"CUDA Está Disponível? ", torch_aval)
print("Versão do PyTorch: ", torch.__version__)
print("Versão do Lightning: ", pl.__version__)
print()
print(f'{lable_2:-^100}\n')
!nvidia-smi
gc.collect()
print()
print(f"Limpando a Memória da GPU (se disponível): ", torch.cuda.empty_cache())
print(f'\n{lable_3:-^100}')

## Datasets e DataLoaders

In [None]:
# Dados de entrada
dados_entrada = [Variable(torch.Tensor([0, 0])), 
                 Variable(torch.Tensor([0, 1])),
                 Variable(torch.Tensor([1, 0])),
                 Variable(torch.Tensor([1, 1]))]

In [None]:
# Dados de saída
dados_saida = [Variable(torch.Tensor([0])),
               Variable(torch.Tensor([1])),
               Variable(torch.Tensor([1])),
               Variable(torch.Tensor([0]))]

In [None]:
type(dados_entrada)

In [None]:
type(dados_saida)

In [None]:
# Dataset final
dados_final = list(zip(dados_entrada, dados_saida))

In [None]:
type(dados_final)

In [None]:
dados_final

In [None]:
# Prepara o data loader
loader_treinamento = DataLoader(dados_final, batch_size = 1)

In [None]:
type(loader_treinamento)

## Simple Net - Construindo o Primeiro Modelo com PyTorch e Lightning

https://pytorch.org/docs/stable/generated/torch.nn.Linear.html

https://pytorch.org/docs/stable/generated/torch.nn.Sigmoid.html

https://pytorch.org/docs/stable/generated/torch.nn.MSELoss.html

https://pytorch.org/docs/stable/optim.html

https://pytorch.org/docs/stable/generated/torch.optim.Adam.html

https://www.deeplearningbook.com.br/algoritmo-backpropagation-parte-2-treinamento-de-redes-neurais/

In [None]:
class SimpleNet(pl.LightningModule):
  
    # Método construtor
    # Usado para inicializar os parâmetros do modelo
    def __init__(self):

        super(SimpleNet, self).__init__()  # SimpleNet tem previlegios para executar qualquer coisa LightinModule
        
        # Atributos da minha classe. Self é indicacao da SimpleNet
        self.input_layer = nn.Linear(2, 4)  # Camada de entrada       nn é um pacote do torch
        self.output_layer = nn.Linear(4, 1) # Camada de saida
        self.sigmoid = nn.Sigmoid()         # Função de Ativação
        self.loss = nn.MSELoss()            # Função de Perda

    # Método da passada para frente (forward)
    def forward(self, input):
        x = self.input_layer(input)
        x = self.sigmoid(x)
        output = self.output_layer(x)
        return output

    # Método de otimização
    def configure_optimizers(self):
        params = self.parameters()
        optimizer = optim.Adam(params = params, lr = 0.01)  # Aplica uma otimizacao usando Adam,lr é velocidade de treinamento (learning rate )
        return optimizer

    # Método das passadas de treinamento
    def training_step(self, batch, batch_idx):   # batch registro de entradas
        entrada, saida = batch
        outputs = self(entrada) 
        loss = self.loss(outputs, saida)         # Função de perda
        return loss 

**Compreendendo as dimensões em nn.Linear(2, 4)**

Especificação da função: torch.nn.Linear(in_features, out_features, bias=True)

- in_features – Tamanho da matriz dos dados de entrada. Em nosso exemplo 2 x 4.

- out_features – Tamanho da matriz dos dados de saída. Em nosso exemplo valor 4 x 1.

- bias - Valor aditivo (padrão igual a True).

Para que a multiplicação de matrizes aconteça, usamos a primeira dimensão de input e a primeira dimensão de output. Em nosso exemplo 2 x 4.

Cada valor de entrada será multiplicado por um valor de peso e ao final o modelo aprende os valores ideais dos pesos que representa a relação entre dados de entrada e saída.

Observe que usamos batch_size igual a 1 e nesse caso cada registro é uma unidade, o que influencia na dimensão das matrizes de dados.

Para facilitar a visualização use o link abaixo:

https://matrix.reshish.com/multiplication.php

**Compreendendo as dimensões em nn.Linear(4, 1)**

Aqui a primeira dimensão (4) é a saída da camada anterior. A segunda dimensão (1) é o número de previsões para cada. amostra de entrada.

## Loop de Treinamento

In [None]:
# Cria o modelo
modelo = SimpleNet()

In [None]:
# Cria o callback de checkpoint
checkpoint_callback = ModelCheckpoint()

In [None]:
# Cria o trainer
trainer = pl.Trainer(devices = 1,
                     accelerator = 'cpu',
                     max_epochs = 100,                  # Passada de treinamento
                     callbacks = [checkpoint_callback])

In [None]:
# Treinamento
trainer.fit(modelo, train_dataloaders = loader_treinamento)

In [None]:
# Qual dispositivo foi usado no modelo?
modelo.device 

In [None]:
# Qual a arquitetura do modelo?
modelo.eval()

In [None]:
# Resumo completo do modelo
modelo.state_dict()

In [None]:
ls lightning_logs/*/  # Ver conteudo da pasta

## Avaliação do Modelo

In [None]:
# Extrai o melhor modelo do checkpoint
melhor_modelo = (checkpoint_callback.best_model_path)

In [None]:
print(melhor_modelo)

In [None]:
# Carrega o modelo do último checkpoint
modelo_final = modelo.load_from_checkpoint(checkpoint_callback.best_model_path)

In [None]:
modelo_final.state_dict()

In [None]:
# Novo registro de entrada
novo_dado_entrada_A = Variable(torch.Tensor([1, 1]))

In [None]:
# Faz a previsão
pred_A = modelo_final(novo_dado_entrada_A)

In [None]:
print(pred_A)

In [None]:
print('A previsão de classe de pred_A é: ', int(pred_A.round()))

In [None]:
# Novos dados de entrada
novos_dados = [Variable(torch.Tensor([1, 1])), 
               Variable(torch.Tensor([0, 0])),
               Variable(torch.Tensor([1, 0])),
               Variable(torch.Tensor([0, 1]))]

In [None]:
# Loop de teste
for val in novos_dados:
    
    # Faz a previsão de cada registro
    previsao = modelo_final(val)
    
    # Imprime o resultado
    print([int(val [0]), int(val [1])], int(previsao.round()))

In [None]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Data Science Academy" --iversions

# Fim