# Introdu√ß√£o √†s Redes Neurais com PyTorch

## Objetivo da Aula:

Nesta aula, vamos explorar passo a passo o funcionamento de uma rede neural artificial para **classifica√ß√£o bin√°ria** utilizando a biblioteca **PyTorch**. O c√≥digo fornecido ser√° usado como exemplo pr√°tico para entender cada etapa do processo de constru√ß√£o e treinamento de um modelo de aprendizado profundo (*deep learning*).

## Introdu√ß√£o ao Problema

O objetivo √© criar um classificador bin√°rio que aprenda a prever se a soma de duas vari√°veis aleat√≥rias √© maior que 1.

> **Exemplo de regra:**  
> - Se $ x_1 + x_2 > 1 \Rightarrow y = 1 $ (classe positiva)  
> - Caso contr√°rio, $ y = 0 $ (classe negativa)

Esse tipo de problema pode ser resolvido com modelos lineares simples, mas usaremos uma rede neural mais complexa para fins did√°ticos.

## Importando as bibliotecas

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

## Gera√ß√£o dos Dados Sint√©ticos

In [2]:
np.random.seed(42)
X_data = np.random.rand(200, 2)  # 200 amostras, 2 features
y_data = (X_data[:,0] + X_data[:,1] > 1.0).astype(int)

### Explica√ß√£o:

 Ex.: y=1 se (x1 + x2 > 1.0), caso contr√°rio y=0 (uma l√≥gica simples).

- `np.random.rand(200, 2)` gera 200 pares de n√∫meros entre 0 e 1.
- A linha `(X_data[:,0] + X_data[:,1] > 1.0).astype(int)` cria r√≥tulos bin√°rios com base na regra definida.

üìå **Objetivo do seed**: Garantir reprodutibilidade dos resultados.

## Divis√£o em Treino e Teste

In [3]:
X_train, X_test, y_train, y_test = train_test_split(
    X_data, y_data, test_size=0.3, random_state=42
)

### Explica√ß√£o:
- Usamos `train_test_split` do `sklearn.model_selection` para dividir os dados em:
  - 70% para **treino**
  - 30% para **teste**
- Isso evita que o modelo memorize os dados e garante que ele generalize bem.

## Convers√£o para Tensores do PyTorch

In [12]:
X_train_t = torch.tensor(X_train, dtype=torch.float32)
y_train_t = torch.tensor(y_train, dtype=torch.float32).view(-1,1)

X_test_t = torch.tensor(X_test, dtype=torch.float32)
y_test_t = torch.tensor(y_test, dtype=torch.float32).view(-1,1)

### Explica√ß√£o:
- O PyTorch trabalha com tensores (`torch.Tensor`) em vez de arrays NumPy.
- `.view(-1,1)` transforma o vetor de r√≥tulos em uma coluna (formato exigido pela fun√ß√£o de perda).

## Defini√ß√£o da Rede Neural

In [13]:
class AdvancedNet(nn.Module):
    def __init__(self, input_dim=2):
        super(AdvancedNet, self).__init__()
        self.fc1 = nn.Linear(input_dim, 8)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(8, 4)
        self.fc3 = nn.Linear(4, 1)

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        x = self.relu(x)
        x = self.fc3(x)
        return x

### Estrutura da Rede:
| Camada | Fun√ß√£o |
|--------|--------|
| `fc1`: Linear(2 ‚Üí 8) | Primeira camada oculta |
| `ReLU` | Fun√ß√£o de ativa√ß√£o n√£o linear |
| `fc2`: Linear(8 ‚Üí 4) | Segunda camada oculta |
| `ReLU` | Nova ativa√ß√£o |
| `fc3`: Linear(4 ‚Üí 1) | Camada de sa√≠da (logits) |

üí° **Importante**: N√£o aplicamos `sigmoid` no final porque usaremos `BCEWithLogitsLoss`, que inclui isso internamente.

## Criando o Modelo

In [14]:
model = AdvancedNet(input_dim=2)

## Fun√ß√£o de Perda e Otimizador

In [9]:

criterion = nn.BCEWithLogitsLoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)

### Explica√ß√£o:

- **`BCEWithLogitsLoss`**:
  - Combina `Sigmoid` + `Binary Cross Entropy Loss`.
  - Ideal para problemas de classifica√ß√£o bin√°ria.
- **`Adam`**:
  - Um otimizador adaptativo que ajusta automaticamente as taxas de aprendizado.
  - Mais eficiente que o SGD cl√°ssico.

## Loop de Treinamento

In [10]:
epochs = 20
for epoch in range(epochs):
    outputs = model(X_train_t)
    loss = criterion(outputs, y_train_t)
    
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    if (epoch+1) % 5 == 0:
        print(f"√âpoca {epoch+1}/{epochs}, Perda Treino: {loss.item():.4f}")

√âpoca 5/20, Perda Treino: 0.6933
√âpoca 10/20, Perda Treino: 0.6792
√âpoca 15/20, Perda Treino: 0.6683
√âpoca 20/20, Perda Treino: 0.6538


### Etapas do Treinamento:

1. **Forward pass**: Calcula a sa√≠da do modelo.
2. **C√°lculo da perda**: Compara previs√£o com valor real.
3. **Backward pass (backpropagation)**: Calcula gradientes.
4. **Atualiza√ß√£o dos pesos**: Usa o otimizador para ajustar os par√¢metros.

üìå **Dica**: Imprimir a perda a cada poucas √©pocas ajuda a monitorar o progresso.

## Avalia√ß√£o do Modelo

In [15]:
with torch.no_grad():
    logits_test = model(X_test_t)
    probs_test = torch.sigmoid(logits_test)
    preds_test = (probs_test > 0.5).float()

    acc = accuracy_score(y_test_t.numpy(), preds_test.numpy())
    print(f"\nAcur√°cia no teste: {acc*100:.2f}%")


Acur√°cia no teste: 50.00%


### Explica√ß√£o:

- `torch.no_grad()` desativa o c√°lculo de gradientes (economiza mem√≥ria).
- `torch.sigmoid` converte os *logits* para probabilidades entre 0 e 1.
- `preds_test = (probs_test > 0.5).float()` aplica o limiar de decis√£o.
- Usamos `accuracy_score` do `sklearn.metrics` para medir a acur√°cia.

## Considera√ß√µes Finais

### Pontos-Chave Abordados:

- Como gerar dados sint√©ticos para aprendizado supervisionado.
- Como preparar os dados para uso no PyTorch.
- Estrutura b√°sica de uma rede neural feedforward.
- Uso de fun√ß√µes de ativa√ß√£o (ReLU) e camadas densas (Linear).
- Uso de BCEWithLogitsLoss para classifica√ß√£o bin√°ria.
- Implementa√ß√£o do loop de treinamento com Adam.
- Avalia√ß√£o de desempenho com acur√°cia.

### Sugest√µes para Pr√≥ximos Passos:

- Adicionar regulariza√ß√£o (Dropout, L2).
- Experimentar diferentes arquiteturas.
- Visualizar as fronteiras de decis√£o aprendidas.
- Trabalhar com conjuntos de dados reais (como Iris ou Breast Cancer do Scikit-learn).