# **Redes Neuronales**

**Equipo:**
* Integrante 1 (XX%)
* Integrante 2 (XX%)
* Integrante 3 (XX%)
* Integrante 4 (XX%)

## **Objetivo**

Implementar manualmente el backpropagation en un Perceptrón Multicapa (MLP) para demostrar el Teorema de Aproximación Universal.  
Se inicia con la clásica función XOR y se avanza hacia un problema real de regresión con el dataset **Airfoil Self‑Noise** de la NASA.  
El reto pone a prueba la capacidad de los MLP para aproximar relaciones no lineales *sin ayuda de librerías de autodiferenciación* y anima a experimentar con arquitecturas bajo un límite de 10 000 parámetros.

## **Tareas**

1. **Validación con XOR**  
   - Construir y entrenar un MLP “desde cero” para reproducir la tabla de verdad XOR.  
   - Evaluar el desempeño con Error Cuadrático Medio (MSE) y mostrar la frontera de decisión.

2. **Predicción de ruido aerodinámico (Airfoil)**  
   - Preprocesar y dividir el dataset 70/15/15.  
   - Diseñar la arquitectura, entrenar y optimizar el MLP para minimizar **RMSE**.  
   - Mantener el recuento total de parámetros **< 10 000**.  
   - Incluir verificación de gradiente numérico en 10 muestras aleatorias.

3. **Análisis y comparación**  
   - Graficar las curvas de entrenamiento/validación.  
   - Comparar contra una Regresión Lineal base.  
   - Discutir evidencias que respalden el Teorema de Aproximación Universal.

## **Entregables**

1. **Canvas**  
   - Notebook (.ipynb) con código, verificación de gradientes, curvas y análisis crítico.  

2. **Foro**  
   - Publicar RMSE final en test + número de parámetros.  
   - Adjuntar captura de la salida del *gradient‑check*.

#### **Importar librerias y dataset**

In [None]:
import numpy as np
import urllib.request, os, copy, math, random
import matplotlib.pyplot as plt

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/00291/airfoil_self_noise.dat"
fname = "airfoil_self_noise.dat"
if not os.path.exists(fname):
    urllib.request.urlretrieve(url, fname)

data = np.loadtxt(fname)
X = data[:, :5]
y = data[:, 5:]

print("Dataset shape:", X.shape, y.shape)

Dataset shape: (1503, 5) (1503, 1)


In [None]:
# Train / val / test split
rng = np.random.default_rng(42)
idx = rng.permutation(len(X))
n_train = int(0.7 * len(X))
n_val = int(0.85 * len(X))
train_idx, val_idx, test_idx = idx[:n_train], idx[n_train:n_val], idx[n_val:]

X_train, y_train = X[train_idx], y[train_idx]
X_val, y_val = X[val_idx], y[val_idx]
X_test, y_test = X[test_idx], y[test_idx]

# Normalize
x_mean, x_std = X_train.mean(0, keepdims=True), X_train.std(0, keepdims=True)
y_mean, y_std = y_train.mean(), y_train.std()

def norm_x(x): return (x - x_mean) / x_std
def norm_y(t): return (t - y_mean) / y_std
def denorm_y(tn): return tn * y_std + y_mean

X_train, X_val, X_test = map(norm_x, (X_train, X_val, X_test))
y_train_n, y_val_n, y_test_n = map(norm_y, (y_train, y_val, y_test))
print("Splits:", X_train.shape, X_val.shape, X_test.shape)

Splits: (1052, 5) (225, 5) (226, 5)


## **1. Capas bases**

In [None]:
# CODE HERE for backward pass

# f0, f1, f2
class Linear:
    def __init__(self, in_dim, out_dim):
        self.W = np.random.randn(in_dim, out_dim) * np.sqrt(2.0 / in_dim)
        self.b = np.zeros((1, out_dim))
    def forward(self, x):
        self.x = x
        return x @ self.W + self.b

# h0, h1, h2, ....
class ReLU:
    def forward(self, x):
        self.mask = x > 0
        return x * self.mask

# error
class MSELoss:
    def forward(self, pred, target):
        self.diff = pred - target
        return np.mean(self.diff ** 2)

# **2. Red MLP**

In [None]:
class MLP:
    def __init__(self, dims):
        self.layers = []
        for i in range(len(dims)-2):
            self.layers.append(Linear(dims[i], dims[i+1])) #fi
            self.layers.append(ReLU()) # hi
        self.layers.append(Linear(dims[-2], dims[-1]))

    # CODE HERE (forward, backward pass)

    @property
    def n_params(self):
        total = 0
        for l in self.layers:
            if isinstance(l, Linear):
                total += l.W.size + l.b.size
        return total

# **3. Gradient check**

In [None]:
def grad_check(model, x, y, eps=1e-5, tol=1e-4):
    loss_fn = MSELoss()
    pred = model.forward(x)
    loss = loss_fn.forward(pred, y)
    grad = loss_fn.backward()
    model.backward(grad)
    lin = next(l for l in model.layers if isinstance(l, Linear))
    i, j = np.random.randint(lin.W.shape[0]), np.random.randint(lin.W.shape[1])
    orig = lin.W[i, j]
    lin.W[i, j] = orig + eps
    plus = loss_fn.forward(model.forward(x), y)
    lin.W[i, j] = orig - eps
    minus = loss_fn.forward(model.forward(x), y)
    lin.W[i, j] = orig
    num_grad = (plus - minus) / (2*eps)
    ana_grad = lin.grad_W[i, j]
    rel_err = abs(num_grad - ana_grad) / max(1e-8, abs(num_grad)+abs(ana_grad))
    print('rel error', rel_err)
    return rel_err < tol

tmp = MLP([5,8,4,1])
grad_check(tmp, X_train[:10], y_train_n[:10])

# **4. Entrenamiento**

In [None]:
dims = [5, 64, 32, 16, 1]
lr = 0.01
epochs = 500
batch = 64
model = MLP(dims)
print('Parámetros totales:', model.n_params)
loss_fn = MSELoss()
train_hist, val_hist = [], []

for ep in range(1, epochs+1):
  # CODE HERE
  pass

# **5. Evaluación**

In [None]:
te_pred = model.forward(X_test)
test_rmse = np.sqrt(np.mean((denorm_y(te_pred)-y_test)**2))
print('Test RMSE:', test_rmse)

In [None]:
plt.plot(np.arange(len(train_hist))*10+1, train_hist, label='Train')
plt.plot(np.arange(len(val_hist))*10+1, val_hist, label='Val')
plt.xlabel('Epoch')
plt.ylabel('RMSE')
plt.legend()
plt.title('Curva de aprendizaje')
plt.show()

# **6. Análisis crítico**
- Discute influencia de arquitectura, overfitting, Universal Approximation, etc.