# Solucionario

Este cuaderno contiene las soluciones a los ejercicios planteados.

---

# Proyecto Final: Predicción de Precios de Vivienda

Bienvenido al proyecto final del curso. Aquí pondrás a prueba tus habilidades en Python, Pandas, Visualización y Machine Learning.

## 1. Carga y Exploración de Datos

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar dataset
df = pd.read_csv('data/housing.csv')
print(df.head())

In [None]:
# Resumen estadístico
print(df.describe())

## 2. Visualización (EDA)
Vamos a ver cómo correlacionan las variables con el precio.

In [None]:
plt.figure(figsize=(10, 6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.title("Mapa de Correlaciones")
plt.show()

In [None]:
plt.figure(figsize=(8, 5))
sns.scatterplot(data=df, x='Metros_Cuadrados', y='Precio', hue='Ubicacion_Centro')
plt.title("Precio vs Metros Cuadrados")
plt.show()

## 3. Preprocesamiento y Feature Engineering
Podemos calcular la antigüedad de la vivienda.

In [None]:
anyo_actual = 2025
df['Antiguedad'] = anyo_actual - df['Año_Construccion']
print(df[['Año_Construccion', 'Antiguedad']].head())

## 4. Entrenamiento del Modelo

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error, r2_score

# Definir X e y
features = ['Metros_Cuadrados', 'Habitaciones', 'Baños', 'Ubicacion_Centro', 'Antiguedad']
X = df[features]
y = df['Precio']

# Split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Modelo Lineal
model_lr = LinearRegression()
model_lr.fit(X_train, y_train)
y_pred_lr = model_lr.predict(X_test)

# Modelo Random Forest
model_rf = RandomForestRegressor(n_estimators=100, random_state=42)
model_rf.fit(X_train, y_train)
y_pred_rf = model_rf.predict(X_test)

## 5. Evaluación
Comparemos los modelos.

In [None]:
print("--- Regresión Lineal ---")
print(f"R2 Score: {r2_score(y_test, y_pred_lr):.4f}")
print(f"MAE: {mean_absolute_error(y_test, y_pred_lr):.2f}")

print("\n--- Random Forest ---")
print(f"R2 Score: {r2_score(y_test, y_pred_rf):.4f}")
print(f"MAE: {mean_absolute_error(y_test, y_pred_rf):.2f}")

## 6. Conclusión
Escribe aquí tus conclusiones sobre qué variables influyen más en el precio y qué modelo funcionó mejor.