## Gradiente Descendente Estoc√°stico

### Diferencias clave con el gradiente descendente cl√°sico
* Se actualizan los par√°metros por cada punto de entrenamiento, no por el conjunto completo.
* Se barajan los datos en cada √©poca, lo que mejora la convergencia.
* SGD es √∫til cuando tienes grandes vol√∫menes de datos, ya que permite comenzar a aprender desde el primer ejemplo.

## Problema
Ajustar una l√≠nea recta $ùë¶=ùë§ùë•+ùëè$ a un conjunto de datos, minimizando el error cuadr√°tico medio (MSE) entre las predicciones y los valores reales.

### Importar librer√≠as

In [None]:
import numpy as np
import matplotlib.pyplot as plt

### Datos sint√©ticos con ruido

In [None]:
np.random.seed(42)
x = np.linspace(0, 10, 150)
y = 2.5 * x + 1.0 + np.random.normal(0, 2, size=x.shape)

### Par√°metros de entrenamiento

In [None]:
learning_rate = 0.01
epochs = 10  # se recorren todos los datos varias veces
w = 0.0  # pendiente (peso)
b = 0.0  # sesgo
n = len(x)
losses = []

### Entrenamiento con gradiente descendente estoc√°stico (SGD)

In [None]:
for epoch in range(epochs):
    indices = np.random.permutation(n)  # Se barajan aleatoriamente los √≠ndices de los datos en cada √©poca (importante en SGD)

    for i in indices:  # Se recorre cada muestra individualmente (uno por uno)
        xi = x[i]      # Entrada i-√©sima
        yi = y[i]      # Salida/valor real correspondiente

        # Predicci√≥n con los par√°metros actuales
        y_pred = w * xi + b
        error = y_pred - yi  # Error entre la predicci√≥n y el valor real

        # Derivadas del error cuadr√°tico con respecto a w y b para un solo ejemplo
        dw = 2 * xi * error
        db = 2 * error

        # Actualizaci√≥n de los par√°metros (peso y sesgo)
        w -= learning_rate * dw
        b -= learning_rate * db

    # Calcular y guardar p√©rdida (MSE) al final de cada √©poca
    y_pred_total = w * x + b
    loss = np.mean((y_pred_total - y) ** 2)
    losses.append(loss)
    print(f"√âpoca {epoch+1}: w = {w:.4f}, b = {b:.4f}, Loss = {loss:.4f}")

# Mostrar modelo final
print(f"\nModelo final: y = {w:.4f}x + {b:.4f}")

### Graficar resultados

In [None]:
plt.figure(figsize=(14, 5))

plt.subplot(1, 2, 1)
plt.scatter(x, y, label="Datos reales", alpha=0.7)
plt.plot(x, w * x + b, color="red", label="Modelo ajustado (SGD)")
plt.xlabel("x")
plt.ylabel("y")
plt.title("Regresi√≥n lineal con Gradiente Descendente Estoc√°stico")
plt.legend()
plt.grid(True)

plt.subplot(1, 2, 2)
plt.plot(range(1, epochs + 1), losses, marker='o')
plt.xlabel("√âpoca")
plt.ylabel("P√©rdida (MSE)")
plt.title("Evoluci√≥n del error")
plt.grid(True)

plt.tight_layout()
plt.show()