In [None]:

# Importación de librerías y dataset
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Cargar el dataset de California Housing
from sklearn.datasets import fetch_california_housing
dataset = fetch_california_housing()
X = dataset.data[:, [0]]  # Utilizando la característica 'MedInc' (ingreso promedio)
y = dataset.target

# Visualización inicial de los datos
# Convertir a un DataFrame para facilidad de manejo
data = pd.DataFrame(data=np.c_[X, y], columns=['MedInc', 'HouseValue'])

# Visualizar los primeros datos
print(data.head())

# Graficar los datos
plt.scatter(data['MedInc'], data['HouseValue'], color='blue')
plt.title("Ingreso promedio vs Valor de vivienda")
plt.xlabel("Ingreso promedio")
plt.ylabel("Valor de la vivienda")
plt.show()

# División de los datos en conjuntos de entrenamiento y prueba
# División del conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Mostrar la forma de los conjuntos de entrenamiento y prueba
print(f"Entrenamiento: {X_train.shape}, {y_train.shape}")
print(f"Prueba: {X_test.shape}, {y_test.shape}")

# Creación de un modelo de Regresión Lineal para comparación
# Crear el modelo de regresión lineal
linear_regressor = LinearRegression()
linear_regressor.fit(X_train, y_train)

# Predicción sobre el conjunto de prueba
y_pred_linear = linear_regressor.predict(X_test)

# Visualizar los resultados del modelo lineal
plt.scatter(X_test, y_test, color='blue', label='Datos reales')
plt.plot(X_test, y_pred_linear, color='red', label='Modelo Lineal')
plt.title("Regresión Lineal: Ingreso promedio vs Valor de vivienda")
plt.xlabel("Ingreso promedio")
plt.ylabel("Valor de la vivienda")
plt.legend()
plt.show()

# Implementación de Regresión Polinómica
# Transformar las características a polinómicas de grado 3
poly = PolynomialFeatures(degree=3)
X_train_poly = poly.fit_transform(X_train)
X_test_poly = poly.transform(X_test)

# Crear el modelo de regresión polinómica
poly_regressor = LinearRegression()
poly_regressor.fit(X_train_poly, y_train)

# Predicción sobre el conjunto de prueba
y_pred_poly = poly_regressor.predict(X_test_poly)

# Visualización del ajuste del modelo polinómico
plt.scatter(X_test, y_test, color='blue', label='Datos reales')
plt.scatter(X_test, y_pred_poly, color='green', label='Modelo Polinómico')
plt.title("Regresión Polinómica: Ingreso promedio vs Valor de vivienda")
plt.xlabel("Ingreso promedio")
plt.ylabel("Valor de la vivienda")
plt.legend()
plt.show()

# Evaluación del rendimiento del modelo
# Métricas del modelo lineal
mse_linear = mean_squared_error(y_test, y_pred_linear)
r2_linear = r2_score(y_test, y_pred_linear)

# Métricas del modelo polinómico
mse_poly = mean_squared_error(y_test, y_pred_poly)
r2_poly = r2_score(y_test, y_pred_poly)

# Mostrar las métricas
print(f"MSE Modelo Lineal: {mse_linear:.4f}")
print(f"R2 Modelo Lineal: {r2_linear:.4f}")
print(f"MSE Modelo Polinómico: {mse_poly:.4f}")
print(f"R2 Modelo Polinómico: {r2_poly:.4f}")