# Lab 05: Backpropagation - Práctica

## Objetivos
1. Implementar backpropagation desde cero
2. Verificar con gradientes numéricos
3. Visualizar grafos computacionales
4. Entrenar una red completa

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import sys
sys.path.append('codigo/')
from backprop import *

plt.style.use('seaborn-v0_8-darkgrid')
%matplotlib inline

## Parte 1: Grafo Computacional Simple

Ejemplo: z = (x + y) * w

In [None]:
visualizar_grafo_computacional()

## Parte 2: Verificación de Gradientes

Comparar gradientes analíticos vs numéricos.

In [None]:
verificar_gradientes()

## Parte 3: Red Neuronal con Backprop

Entrenar en problema XOR.

In [None]:
entrenar_ejemplo()

## Parte 4: Implementación Manual

Implementa tu propia versión paso a paso.

In [None]:
# Red simple: 2 → 3 → 1
np.random.seed(42)

# Datos XOR
X = np.array([[0, 0, 1, 1], [0, 1, 0, 1]])
y = np.array([[0, 1, 1, 0]])

# Inicializar pesos
W1 = np.random.randn(3, 2) * 0.1
b1 = np.zeros((3, 1))
W2 = np.random.randn(1, 3) * 0.1
b2 = np.zeros((1, 1))

learning_rate = 0.5
losses = []

for epoch in range(1000):
    # FORWARD PASS
    z1 = W1 @ X + b1
    a1 = np.maximum(0, z1)  # ReLU
    
    z2 = W2 @ a1 + b2
    a2 = 1 / (1 + np.exp(-z2))  # Sigmoid
    
    # Loss
    epsilon = 1e-15
    loss = -np.mean(y * np.log(a2 + epsilon) + (1 - y) * np.log(1 - a2 + epsilon))
    losses.append(loss)
    
    # BACKWARD PASS
    # Gradiente de la pérdida
    da2 = a2 - y
    
    # Capa 2
    dz2 = da2 * a2 * (1 - a2)  # Derivada sigmoid
    dW2 = dz2 @ a1.T / X.shape[1]
    db2 = np.sum(dz2, axis=1, keepdims=True) / X.shape[1]
    da1 = W2.T @ dz2
    
    # Capa 1
    dz1 = da1 * (z1 > 0)  # Derivada ReLU
    dW1 = dz1 @ X.T / X.shape[1]
    db1 = np.sum(dz1, axis=1, keepdims=True) / X.shape[1]
    
    # UPDATE
    W1 -= learning_rate * dW1
    b1 -= learning_rate * db1
    W2 -= learning_rate * dW2
    b2 -= learning_rate * db2
    
    if epoch % 200 == 0:
        print(f"Época {epoch}: Loss = {loss:.6f}")

print(f"\nPredicciones finales: {a2}")
print(f"Valores reales:       {y}")

# Visualizar
plt.figure(figsize=(10, 6))
plt.plot(losses, linewidth=2)
plt.xlabel('Época')
plt.ylabel('Pérdida')
plt.title('Entrenamiento Manual con Backpropagation')
plt.yscale('log')
plt.grid(True, alpha=0.3)
plt.show()

## Resumen

**Backpropagation** es:
- Aplicación de la regla de la cadena
- Eficiente (un pase calcula todos los gradientes)
- Fundamental para deep learning

**Proceso**:
1. Forward: calcular predicciones (guardar intermedios)
2. Loss: calcular error
3. Backward: calcular gradientes (regla de la cadena)
4. Update: ajustar parámetros

**¡La magia del deep learning! ✨**