# Descenso por gradiente

In [None]:
import numpy as np
import matplotlib.pyplot as plt

## Generación de datos

Generamos un conjunto aleatorio de datos.

In [None]:
np.random.seed(42)

X = np.linspace(0, 10, 50)
y = 3 * X + np.random.randn(50) * 3

plt.scatter(X, y)
plt.xlabel("X")
plt.ylabel("y")
plt.title("Datos")
plt.show()

## Algoritmo de descenso por gradiente

Partimos de una pendiente y un intercepto de 0. También podría iniciarse con un valor aleatorio.

Para cada elemento del conjunto de datos calculamos el error de su predicción teniendo en cuenta la pendiente y el intercepto.

Calculamos el error y el gradiente.

Actualizamos la pendiente y el intercepto.

Calculamos el coste para poder mostrarlo en el historial, pero no afecta al algoritmo.

In [None]:
def gradiente_descendente(X, y, alpha, iteraciones):
    # Inicializar parámetros
    m = 0.0  # pendiente
    b = 0.0  # intercepto

    n = len(X)
    historial_coste = []

    for i in range(iteraciones):
        # Predicciones
        y_pred = m * X + b

        # Cálculo del error
        error = y_pred - y

        # Gradientes
        dm = (2/n) * np.dot(error, X)
        db = (2/n) * np.sum(error)

        # Actualización de parámetros
        m -= alpha * dm
        b -= alpha * db

        # Calcular coste (MSE)
        coste = (1/n) * np.sum((y - y_pred)**2)
        historial_coste.append(coste)

    return m, b, historial_coste


## Ejecutamos el algoritmo

Para cada tasa de aprendizaje lanzamos el algoritmo y mostramos el comportamiento de su coste.

Puedes probar con diferentes tasas a ver que pasa.

In [None]:
tasa_aprendizaje = [0.000001,0.00001]
iteraciones = 100

plt.figure(figsize=(10,6))

for alpha in tasa_aprendizaje:
    m, b, historial = gradiente_descendente(X, y, alpha, iteraciones)
    plt.plot(historial, label=f"alpha={alpha}")

plt.xlabel("Iteraciones")
plt.ylabel("Coste (MSE)")
plt.ylim(0, 1000)
plt.title("Evolución del coste para distintas tasas de aprendizaje")
plt.legend()
plt.show()
