**Prática 09**: Implementando uma Rede Neural do Zero com NumPy

**Objetivo:** Compreender o funcionamento interno de uma rede neural (MLP), implementando as etapas de forward propagation, backpropagation e atualização dos pesos **do zero**, utilizando apenas NumPy.


### Etapas:
1. Inicializar os pesos e bias
2. Implementar a propagação direta (forward)
3. Implementar a retropropagação do erro (backward)
4. Treinar e testar a rede
5. (Desafio) Adaptar para regressão simples



In [1]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, confusion_matrix

# Carregar e preparar os dados (Iris). Simplificação dos dados para melhorar a didática
data = load_iris()
X = data.data[data.target != 2][:, :2]  # Usar apenas 2 features para visualização
y = data.target[data.target != 2].reshape(-1, 1)  # Classes 0 e 1

# Padronização dos dados
scaler = StandardScaler()
X = scaler.fit_transform(X)

# Separar em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print("Formato dos dados de treino:", X_train.shape, y_train.shape)

Formato dos dados de treino: (80, 2) (80, 1)


In [2]:
# Funções auxiliares de ativação e derivadas

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivada(x):
    return sigmoid(x) * (1 - sigmoid(x))

def relu(x):
    return np.maximum(0, x)

def relu_derivada(x):
    return (x > 0).astype(float)

def mse(y_true, y_pred):
    return np.mean((y_true - y_pred) ** 2)

def mse_derivada(y_true, y_pred):
    return 2 * (y_pred - y_true) / y_true.size

In [3]:
# Inicialização dos pesos
np.random.seed(0)
input_size = 2
hidden_size = 5
output_size = 1

W1 = np.random.randn(input_size, hidden_size)
b1 = np.zeros((1, hidden_size))

# TODO: Complete a inicialização dos pesos e bias
W2 = np.random.randn(hidden_size, output_size)
b2 = np.zeros((1, output_size))

In [4]:
# Forward propagation
# TODO: Complete a implementação do forward
def forward(X):
    global Z1, A1, Z2, A2
    Z1 = np.dot(X, W1) + b1
    A1 = relu(Z1)
    Z2 = np.dot(A1, W2) + b2
    A2 = sigmoid(Z2)
    return A2

In [5]:
# Backpropagation
def backward(X, y, learning_rate=0.01):
    global W1, b1, W2, b2
    m = y.shape[0]

    dZ2 = mse_derivada(y, A2) * sigmoid_derivada(Z2)
    dW2 = np.dot(A1.T, dZ2) / m
    db2 = np.sum(dZ2, axis=0, keepdims=True) / m

    # TODO: Complete os cálculos de gradientes e atualização dos pesos
    dZ1 = np.dot(dZ2, W2.T) * relu_derivada(Z1)
    dW1 = np.dot(X.T, dZ1) / m
    db1 = np.sum(dZ1, axis=0, keepdims=True) / m

    W1 -= learning_rate * dW1
    b1 -= learning_rate * db1
    W2 -= learning_rate * dW2
    b2 -= learning_rate * db2

In [7]:
# Treinamento da rede
# TODO: Execute o treinamento por 10000 épocas e utilize o mse como função de perda (erro)
for epoca in range(10000):
    y_pred = forward(X_train)
    erro = mse(y_train, y_pred)
    backward(X_train, y_train, learning_rate=0.1)
    if epoca % 1000 == 0:
        print(f"Época {epoca}, Erro: {erro:.4f}")

Época 0, Erro: 0.2534
Época 1000, Erro: 0.2172
Época 2000, Erro: 0.1889
Época 3000, Erro: 0.1676
Época 4000, Erro: 0.1510
Época 5000, Erro: 0.1371
Época 6000, Erro: 0.1263
Época 7000, Erro: 0.1167
Época 8000, Erro: 0.1069
Época 9000, Erro: 0.0986


In [8]:
# Avaliação no conjunto de teste
y_pred_test = forward(X_test)
# TODO: Mostre os resultados finais. Defina um limiar de 0.5 para definir a classe

pred_class = (y_pred_test > 0.5  ).astype(int)

print("Acurácia no teste:", accuracy_score(y_test, pred_class))
print("Matriz de confusão:\n", confusion_matrix(y_test, pred_class))

Acurácia no teste: 0.95
Matriz de confusão:
 [[11  1]
 [ 0  8]]
