# 🏘️ Entrenamiento de Modelo de Predicción de Arriendo
Este notebook genera un modelo de regresión lineal para predecir el precio de arriendo en distintas comunas de Chile, usando datos simulados.
No requiere archivos `.pkl` previos.

In [None]:
# ✅ Paso 1: Instalar dependencias
!pip install pandas scikit-learn joblib

In [None]:
# ✅ Paso 2: Importar librerías
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder
from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer
import joblib

In [None]:
# ✅ Paso 3: Generar dataset simulado
np.random.seed(42)
n = 300
comunas = ['Santiago', 'Providencia', 'Maipú', 'Las Condes', 'Puente Alto']
tipos = ['Departamento', 'Casa']

df = pd.DataFrame({
    'comuna': np.random.choice(comunas, n),
    'tipo': np.random.choice(tipos, n),
    'superficie': np.random.randint(30, 150, n),
    'habitaciones': np.random.randint(1, 5, n),
    'baños': np.random.randint(1, 3, n)
})

base_price = {
    'Santiago': 300000,
    'Providencia': 450000,
    'Maipú': 250000,
    'Las Condes': 500000,
    'Puente Alto': 220000
}

df['precio'] = (
    df['superficie'] * 4200 +
    df['habitaciones'] * 50000 +
    df['baños'] * 30000 +
    df['comuna'].map(base_price) +
    np.random.normal(0, 50000, n)
).astype(int)

df.head()

In [None]:
# ✅ Paso 4: Entrenar el modelo
X = df.drop("precio", axis=1)
y = df["precio"]

preprocessor = ColumnTransformer([
    ('cat', OneHotEncoder(handle_unknown='ignore'), ['comuna', 'tipo'])
], remainder='passthrough')

pipeline = Pipeline([
    ('preprocess', preprocessor),
    ('model', LinearRegression())
])

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
pipeline.fit(X_train, y_train)

In [None]:
# ✅ Paso 5: Guardar el modelo en Colab (opcional)
joblib.dump(pipeline, "modelo_arriendo_chile.pkl")