## Problema
En este ejercicio usaremos el dataset load_diabetes(), que es ideal para tareas de regresión.

Este dataset contiene 442 muestras de pacientes, cada una con 10 variables numéricas (por ejemplo: edad, sexo, índice de masa corporal, etc.), y una variable objetivo continua: una medida cuantitativa de progresión de la diabetes.

### Importar librerías

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_diabetes
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

### Cargar el dataset

In [None]:
data = load_diabetes()
X = data.data  # características
y = data.target  # variable objetivo (progresión de la enfermedad)

### Conjunto de datos diabetes

In [None]:
print(data.DESCR)

### Configuración del modelo

In [None]:
# Usaremos solo una variable para facilitar visualización (por ejemplo, la variable 2: BMI -> Body Mass Index o índice de masa corporal)
X = X[:, 2].reshape(-1, 1)  # reshape para mantener forma matricial

# Escalar o normalizar la variable objetivo (opcional pero útil para estabilidad numérica)
scaler_y = StandardScaler()
y_scaled = scaler_y.fit_transform(y.reshape(-1, 1)).flatten()

# Dividir en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y_scaled, test_size=0.2, random_state=42)

# Inicializar parámetros del modelo
w = 0.0  # peso
b = 0.0  # sesgo
learning_rate = 0.1
epochs = 1000
losses = []

### Entrenamiento con gradiente descendente

In [None]:
for epoch in range(epochs):
    y_pred = w * X_train.flatten() + b  # predicción
    error = y_pred - y_train            # error de predicción

    # Derivadas (gradientes)
    dw = (2 / len(X_train)) * np.dot(error, X_train.flatten())
    db = (2 / len(X_train)) * np.sum(error)

    # Actualización de parámetros
    w -= learning_rate * dw
    b -= learning_rate * db

    # Guardar pérdida (MSE)
    mse = np.mean(error ** 2)
    losses.append(mse)

    if epoch % 100 == 0 or epoch == 999:
        print(f"Época {epoch}: Pérdida (MSE) = {mse:.4f}")

# Mostrar modelo final
print(f"\nModelo entrenado: y = {w:.4f} * x + {b:.4f}")

### Graficar resultados

In [None]:
plt.figure(figsize=(14, 5))

# Visualización de la recta ajustada sobre datos de entrenamiento
plt.subplot(1, 2, 1)
plt.scatter(X_train, y_train, color='blue', label='Datos reales')
plt.plot(X_train, w * X_train + b, color='red', label='Recta ajustada')
plt.xlabel('Índice de masa corporal (escalado)')
plt.ylabel('Progresión (escalada)')
plt.title('Regresión Lineal con Gradiente Descendente')
plt.legend()
plt.grid(True)

# Visualización de la curva de pérdida
plt.subplot(1, 2, 2)
plt.plot(losses)
plt.xlabel('Épocas')
plt.ylabel('MSE')
plt.title('Evolución de la pérdida durante el entrenamiento')
plt.grid(True)
plt.tight_layout()
plt.show()