
Predicci√≥n del Precio de una Vivienda
üéØ Objetivo

Desarrollar un sistema de predicci√≥n que estime el precio de una vivienda en funci√≥n de sus caracter√≠sticas (como superficie, n√∫mero de habitaciones, antig√ºedad, etc.) utilizando regresi√≥n lineal. El sistema debe construirse completamente con clases en Python.



üß± Paso 1: Simular los datos

Clase: SimuladorViviendas

Esta clase se encargar√° de generar un conjunto de datos sint√©ticos con pandas y numpy.

‚úîÔ∏è Instrucciones:

La clase debe llamarse SimuladorViviendas.

Debe tener un m√©todo generar_datos() que devuelva un DataFrame con 200 registros y las siguientes columnas:




üîç Paso 2: Crear el modelo de predicci√≥n

Clase: ModeloPrecioVivienda

Esta clase representar√° el modelo de regresi√≥n lineal. Se encargar√° del entrenamiento, evaluaci√≥n y predicci√≥n.

‚úîÔ∏è M√©todos obligatorios:

entrenar(data: pd.DataFrame):

Separa los datos en variables independientes y la variable objetivo (Precio).

Divide los datos en entrenamiento (80%) y prueba (20%).

Entrena un modelo de regresi√≥n lineal con scikit-learn.

evaluar():

Muestra el error cuadr√°tico medio (MSE).

Muestra el coeficiente de determinaci√≥n R¬≤.

predecir(nueva_vivienda: pd.DataFrame) -> float:

Recibe un DataFrame con las caracter√≠sticas de una vivienda.

Devuelve el precio estimado.



üß™ Paso 3: Probar todo en conjunto

Clase: TestModeloPrecio

Esta clase servir√° como lanzador general para probar que todo funcione correctamente. Dentro del m√©todo ejecutar() debe:

Generar los datos usando SimuladorViviendas.

Entrenar y evaluar el modelo con ModeloPrecioVivienda.

Crear una vivienda de ejemplo (por ejemplo: superficie 120 m¬≤, 3 habitaciones, 10 a√±os de antig√ºedad, 5 km al centro, 2 ba√±os).

Imprimir el precio estimado.



‚úÖ Requisitos t√©cnicos

Usar pandas, numpy y scikit-learn (LinearRegression, train_test_split, mean_squared_error, r2_score).

Las clases deben estar bien documentadas.

El c√≥digo debe poder ejecutarse de principio a fin sin errores.



üß™ Ejemplo de uso

test = TestModeloPrecio()
test.ejecutar()


Salida esperada

Primeras filas de datos simulados:
    Superficie  Habitaciones  Antig√ºedad  Distancia_centro  Ba√±os  \
0   87.454012             4          32          9.810270      3   
1  145.071431             3          39          7.713692      1   
2  123.199394             1           9         12.089466      2   
3  109.865848             4          42          2.476958      2   
4   65.601864             4          43         19.513501      2   
 
          Precio  
0  259267.477436  
1  314958.241175  
2  467942.246565  
3  238538.397746  
4  238781.280758  
Modelo entrenado correctamente.
 
Error Cuadr√°tico Medio (MSE): 14748907009.71
R¬≤ del modelo: 0.02
 
El precio estimado de la vivienda es: $284,716.76


In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Simulaci√≥n de datos
np.random.seed(42)
data = pd.DataFrame({
    'Superficie': np.random.uniform(50, 150, 200),
    'Habitaciones': np.random.randint(1, 6, 200),
    'Antig√ºedad': np.random.randint(0, 50, 200),
    'Distancia_centro': np.random.uniform(1, 20, 200),
    'Ba√±os': np.random.randint(1, 4, 200),
    'Precio': np.random.uniform(100000, 500000, 200)
})

def entrenar_modelo(data):
    """Entrena un modelo de regresi√≥n para predecir el precio de una vivienda."""
    # Separar caracter√≠sticas (X) y variable objetivo (y)
    X = data.drop('Precio', axis=1)
    y = data['Precio']
    
    # Dividir los datos en entrenamiento y prueba
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    
    # Crear y entrenar el modelo de regresi√≥n lineal
    modelo = LinearRegression()
    modelo.fit(X_train, y_train)
    
    # Predecir en el conjunto de prueba
    y_pred = modelo.predict(X_test)
    
    # Evaluaci√≥n del modelo
    mse = mean_squared_error(y_test, y_pred)
    r2 = r2_score(y_test, y_pred)
    
    print(f"Error Cuadr√°tico Medio (MSE): {mse:.2f}")
    print(f"R¬≤ del modelo: {r2:.2f}")
    
    return modelo  
    
    
# Entrenar el modelo
modelo_entrenado = entrenar_modelo(data)

# Crear una nueva vivienda para predecir el precio
nueva_vivienda = pd.DataFrame({
    'Superficie': [120],
    'Habitaciones': [3],
    'Antig√ºedad': [10],
    'Distancia_centro': [5],
    'Ba√±os': [2]
})

# Realizar la predicci√≥n
prediccion = modelo_entrenado.predict(nueva_vivienda)

# Interpretar el resultado
print(f"El precio estimado de la vivienda es: ${prediccion[0]:,.2f}")


Error Cuadr√°tico Medio (MSE): 14748907009.71
R¬≤ del modelo: 0.02
El precio estimado de la vivienda es: $284,716.76
