## Problema
Ajustar una línea recta $𝑦=𝑤𝑥+𝑏$ a un conjunto de datos, minimizando el error cuadrático medio (MSE) entre las predicciones y los valores reales. En otras palabras, encontrar una función lineal que relacione una variable independiente 𝑥 con una variable dependiente 𝑦.

Donde:

* 𝑦 → es la variable objetivo (lo que queremos predecir).
* 𝑥 → es la variable de entrada o predictor.
* 𝑤 → es el peso o pendiente de la recta (cuánto cambia 𝑦 por cada unidad que cambia 𝑥).
* 𝑏 → es el sesgo o intersección con el eje Y (el valor de 𝑦 cuando $𝑥=0$).

El objetivo es encontrar los valores óptimos de 𝑤 y 𝑏 que permitan que esta recta se aproxime lo mejor posible a los datos reales. Es decir, para cada punto de datos (𝑥𝑖, 𝑦𝑖), queremos que la predicción:

$$
\hat{y}_i = w x_i + b
$$

sea lo más cercana posible a la verdadera salida 𝑦𝑖.

Este ejemplo es una forma básica de inteligencia artificial porque implica que un modelo aprende automáticamente una relación entre variables a partir de datos, usando una técnica de optimización para mejorar su desempeño.

### Importar librerías

In [None]:
import numpy as np
import matplotlib.pyplot as plt

### Generar datos sintéticos con ruido

In [None]:
np.random.seed(42)
# Fija la semilla del generador de números aleatorios para que los resultados sean reproducibles.
# Es útil para garantizar que obtengas los mismos resultados cada vez que ejecutes el código.

x = np.linspace(0, 10, 150)
# Genera 150 puntos equiespaciados entre 0 y 10.
# Estos valores simulan las entradas (features) de un conjunto de datos.

y = 2.5 * x + 1.0 + np.random.normal(0, 2, size=x.shape)
# Genera los valores de salida (targets) con una relación lineal: y = 2.5x + 1.0
# A esto se le suma ruido aleatorio con distribución normal (media = 0, desviación estándar = 2)
# para simular datos reales con variabilidad.

### Función de entrenamiento con gradiente descendente

In [None]:
def entrenar_regresion_lineal(x, y, learning_rate, epochs):
    w = 0.0  # Inicializa el peso (pendiente de la recta) en cero
    b = 0.0  # Inicializa el sesgo/intercepto también en cero
    n = len(x)  # Número de datos de entrada
    losses = []  # Lista para registrar la pérdida en cada iteración

    for i in range(epochs):
        y_pred = w * x + b  # Calcula las predicciones con los parámetros actuales
        error = y_pred - y  # Calcula el error (diferencia entre predicción y valor real)

        # Cálculo del gradiente (derivadas parciales de la función de pérdida con respecto a w y b)
        dw = (2/n) * np.dot(error, x)  # Derivada respecto al peso w
        db = (2/n) * np.sum(error)     # Derivada respecto al sesgo b

        # Actualiza los parámetros con gradiente descendente
        w -= learning_rate * dw  # Nuevo valor del peso
        b -= learning_rate * db  # Nuevo valor del sesgo

        # Calcula y guarda el error cuadrático medio (MSE) en esta iteración
        loss = np.mean(error ** 2)
        losses.append(loss)

        # Imprime el progreso cada 10 iteraciones o en la última
        if i % 10 == 0 or i == epochs - 1:
            print(f"Iteración {i:3d}: w = {w:.4f}, b = {b:.4f}, Loss = {loss:.4f}")

    return w, b, losses

### Entrenar modelo y mostrar resultados

In [None]:
# Entrenar modelo
w_final, b_final, historial_loss = entrenar_regresion_lineal(x, y, learning_rate=0.01, epochs=100)

# Mostrar resultados
print(f"\nModelo final: y = {w_final:.4f}x + {b_final:.4f}")

### Graficar resultados

In [None]:
plt.figure(figsize=(14, 5))

plt.subplot(1, 2, 1)
plt.scatter(x, y, label="Datos reales")
plt.plot(x, w_final * x + b_final, color='red', label="Modelo ajustado")
plt.xlabel("x")
plt.ylabel("y")
plt.title("Regresión lineal con gradiente descendente")
plt.legend()
plt.grid(True)

plt.subplot(1, 2, 2)
plt.plot(historial_loss)
plt.xlabel("Iteración")
plt.ylabel("Pérdida (MSE)")
plt.title("Disminución del error durante el entrenamiento")
plt.grid(True)

plt.tight_layout()
plt.show()