# Implementación de Regresión Lineal con Descenso del Gradiente

**Objetivo:**

- Implementar una regresión lineal simple utilizando Python y aplicar el descenso del gradiente para optimizar el modelo.

**Dataset Propuesto:**

- Utilizar el conjunto de datos 'California Housing Dataset' disponible en Scikit-learn.

**Tareas:**
- Cargar y explorar el dataset.
- Implementar la regresión lineal utilizando Scikit-learn.
- Implementar manualmente el descenso del gradiente.
- Comparar los resultados y analizar el rendimiento.

## Paso 1 - Carga y Exploración del Dataset
Contenido:

**Cargar el Dataset:**


In [None]:

from sklearn.datasets import fetch_california_housing
import pandas as pd

california = fetch_california_housing()
X = pd.DataFrame(california.data, columns=california.feature_names)
y = pd.Series(california.target, name='MedHouseVal')

Imprimir el target:

In [None]:
y.head()

Imprimir los features

In [None]:
X.head()

**Exploración Inicial:**
- Visualizar las primeras filas del DataFrame.
- Describir las variables y su significado.
- Realizar gráficos exploratorios (scatter plots, histogramas).

## Paso 2 - Regresión Lineal con Scikit-learn




In [None]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X[['MedInc']], y, test_size=0.2, random_state=42)

# Entrenar el Modelo:

from sklearn.linear_model import LinearRegression

modelo = LinearRegression()
modelo.fit(X_train, y_train)

# Extraer b0 (intercepto) and b1 (pendiente)
b0 = modelo.intercept_
b1 = modelo.coef_[0]

print(f"Intercept (b0): {b0}")
print(f"Coefficient (b1): {b1}")

# Evaluar el Modelo:

y_pred = modelo.predict(X_test)

from sklearn.metrics import mean_squared_error, r2_score

mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)


print(f"MSE: {mse:.2f}")
print(f"R^2: {r2:.2f}")



## Paso 3 - Implementación Manual del Descenso del Gradiente



In [None]:
# Inicializar Parámetros:

import numpy as np

X_b = np.c_[np.ones((X_train.shape[0], 1)), X_train.values]  # Agregar término de sesgo
theta = np.random.randn(2, 1)  # Inicializar theta aleatoriamente



# Definir Hiperparámetros:

learning_rate = 0.01
n_iter = 1000

# Algoritmo de Descenso del Gradiente:

m = X_b.shape[0]

for iteration in range(n_iter):
    gradients = 2/m * X_b.T.dot(X_b.dot(theta) - y_train.values.reshape(-1, 1))
    theta = theta - learning_rate * gradients

print(f"Intercepto (b0): {theta[0]}")
print(f"Coefficiente (b1): {theta[1]}")

# Predicciones y Evaluación:

X_test_b = np.c_[np.ones((X_test.shape[0], 1)), X_test.values]
y_pred_manual = X_test_b.dot(theta)

mse_manual = mean_squared_error(y_test, y_pred_manual)
r2_manual = r2_score(y_test, y_pred_manual)



print(f"MSE (Descenso del Gradiente): {mse_manual:.2f}")
print(f"R^2 (Descenso del Gradiente): {r2_manual:.2f}")



In [None]:
import numpy as np

# Inicializar Parámetros:

X_b = np.c_[np.ones((X_train.shape[0], 1)), X_train.values]  # Agregar término de sesgo
theta = np.random.randn(2, 1)  # Inicializar theta aleatoriamente

print(theta)



In [None]:
# Definir Hiperparámetros:

learning_rate = 0.001
n_iter = 1000

# Algoritmo de Descenso del Gradiente:

m = X_b.shape[0]

cost_history = []  # Lista para almacenar el costo en cada iteración
theta_history = []  # Lista para almacenar los valores de theta en cada iteración

for iteration in range(n_iter):
    gradients = 2/m * X_b.T.dot(X_b.dot(theta) - y_train.values.reshape(-1, 1))

    theta = theta - learning_rate * gradients
    theta_history.append(theta.copy())
    # Calcular el costo actual y almacenarlo
    cost = (1/m) * np.sum((X_b.dot(theta) - y_train.values.reshape(-1, 1))**2)
    cost_history.append(cost)

print(f"Intercepto (b0): {theta[0]}")
print(f"Coefficiente (b1): {theta[1]}")

# Predicciones y Evaluación:

X_test_b = np.c_[np.ones((X_test.shape[0], 1)), X_test.values]
y_pred_manual = X_test_b.dot(theta)

mse_manual = mean_squared_error(y_test, y_pred_manual)
r2_manual = r2_score(y_test, y_pred_manual)


print(f"MSE (Descenso del Gradiente): {mse_manual:.2f}")
print(f"R^2 (Descenso del Gradiente): {r2_manual:.2f}")

In [None]:
import matplotlib.pyplot as plt

# Configurar la figura y los subgráficos
# Añadir un tercer subgráfico para los parámetros theta
fig, axes = plt.subplots(1, 3, figsize=(18, 5))

# Gráfico del costo vs. iteraciones
axes[0].plot(range(n_iter), cost_history, color='blue')
axes[0].set_xlabel('Número de Iteraciones')
axes[0].set_ylabel('Costo')
axes[0].set_title('Recorrido del Gradiente (Costo vs. Iteraciones)')

# Gráfico de los parámetros theta
theta_0_history = [theta[0][0] for theta in theta_history]
theta_1_history = [theta[1][0] for theta in theta_history]

axes[1].plot(range(n_iter), theta_0_history, label='theta_0 (Intercepto)')
axes[1].plot(range(n_iter), theta_1_history, label='theta_1 (Coeficiente)')
axes[1].set_xlabel('Número de Iteraciones')
axes[1].set_ylabel('Valor de Theta')
axes[1].set_title('Evolución de los Parámetros Theta')
axes[1].legend()

# Gráfico de los datos y la línea de regresión
axes[2].scatter(X_test.values, y_test.values, color='blue', label='Datos Reales')
axes[2].plot(X_test.values, y_pred_manual, color='red', linewidth=2, label='Línea de Regresión')
axes[2].set_xlabel('Ingresos medios en el grupo de bloques (MedInc)')
axes[2].set_ylabel('Valor Medio de la Vivienda (MedHouseVal)')
axes[2].set_title('Regresión Lineal Ajustada')
axes[2].legend()

plt.tight_layout()
plt.show()



## Paso 4 - Comparación y Análisis de Resultados

**Comparar Métricas:**

- ¿Los resultados son similares?
- ¿Qué diferencias observas y a qué pueden deberse?


