## Problema

En este ejercicio usaremos el dataset load_diabetes(), que contiene 442 muestras de pacientes, cada una con 10 variables numéricas (por ejemplo: edad, sexo, índice de masa corporal, etc.), y una variable objetivo continua: una medida cuantitativa de progresión de la diabetes.

### Importar librerías

In [None]:
import numpy as np
import matplotlib.pyplot as plt

from sklearn.datasets import load_diabetes
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

### Cargar el dataset

In [None]:
data = load_diabetes()
X = data.data[:, 2]  # Usamos solo la variable "BMI"
y = data.target  # variable objetivo (progresión de la enfermedad)

### Parámetros de entrenamiento

In [None]:
# Escalar la variable de entrada
scaler = StandardScaler()
X = scaler.fit_transform(X.reshape(-1, 1)).flatten()

# Dividir en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar parámetros del modelo
w = 0.0  # peso
b = 0.0  # sesgo
learning_rate = 0.01
epochs = 50
batch_size = 64  # Tamaño del mini-batch
n = len(X_train)
losses = []

### Entrenamiento con gradiente descendente Mini-Batch

In [None]:
for epoch in range(epochs):
    # Barajar los datos al inicio de cada época
    indices = np.random.permutation(n)
    X_train_shuffled = X_train[indices]
    y_train_shuffled = y_train[indices]

    # Recorrer los datos en mini-batches
    for i in range(0, n, batch_size):
        X_batch = X_train_shuffled[i:i+batch_size]
        y_batch = y_train_shuffled[i:i+batch_size]

        # Predicciones y errores
        y_pred = w * X_batch + b
        error = y_pred - y_batch

        # Gradientes
        dw = (2 / len(X_batch)) * np.dot(error, X_batch)
        db = (2 / len(X_batch)) * np.sum(error)

        # Actualización de parámetros
        w -= learning_rate * dw
        b -= learning_rate * db

    # Calcular pérdida total en cada época
    y_pred_total = w * X_train + b
    loss = np.mean((y_pred_total - y_train) ** 2)
    losses.append(loss)

    # Mostrar progreso cada 5 épocas
    if epoch % 5 == 0 or epoch == epochs - 1:
        print(f"Época {epoch}: w = {w:.4f}, b = {b:.4f}, Loss = {loss:.4f}")

# Mostrar modelo final
print(f"\nModelo final: y = {w:.4f}x + {b:.4f}")

### Graficar resultados

In [None]:
plt.figure(figsize=(14, 5))

plt.subplot(1, 2, 1)
plt.scatter(X_train, y_train, color='blue', label='Datos de entrenamiento')
plt.plot(X_train, w * X_train + b, color='red', label='Recta ajustada')
plt.xlabel('BMI (escalado)')
plt.ylabel('Progresión de la enfermedad')
plt.title('Regresión lineal con mini-batch gradient descent')
plt.legend()
plt.grid(True)

plt.subplot(1, 2, 2)
plt.plot(losses)
plt.xlabel('Épocas')
plt.ylabel('MSE')
plt.title('Pérdida durante el entrenamiento')
plt.grid(True)

plt.tight_layout()
plt.show()