# 🏠 Predicción de Precios de Casas

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from src.utils import cargar_datos, dividir_datos

# Cargar datos
df = cargar_datos("../data/casas.csv")
print(df.head())

# Exploración rápida
sns.heatmap(df.corr(), annot=True, cmap="Blues")
plt.title("Matriz de Correlación")
plt.savefig("../reports/correlacion.png", dpi=300)
plt.show()

# División de datos
X_train, X_test, y_train, y_test = dividir_datos(df, "precio")

# Entrenamiento modelo
modelo = LinearRegression()
modelo.fit(X_train, y_train)

# Predicciones
y_pred = modelo.predict(X_test)

# Evaluación
print("MSE:", mean_squared_error(y_test, y_pred))
print("R2:", r2_score(y_test, y_pred))

# Importancia de variables
importances = pd.Series(modelo.coef_, index=X_train.columns)
importances.plot(kind="bar", title="Importancia de Variables")
plt.tight_layout()
plt.savefig("../reports/importancia_variables.png", dpi=300)
plt.show()