<a href="https://colab.research.google.com/github/luismiguelcasadodiaz/IBM_SkillsBuild_IA_325/blob/main/IA_325_py_cod_ex_45_s.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Predicción del Precio de una Vivienda

## 🎯 Objetivo

Desarrollar un sistema de predicción que estime el precio de una vivienda en función de sus características (como superficie, número de habitaciones, antigüedad, etc.) utilizando regresión lineal. El sistema debe construirse completamente con clases en Python.



## 🧱 Paso 1: Simular los datos

Clase: **SimuladorViviendas** .Esta clase se encargará de generar un conjunto de datos sintéticos con pandas y numpy.

✔️ Instrucciones:

La clase debe llamarse SimuladorViviendas.

Debe tener un método generar_datos() que devuelva un DataFrame con 200 registros y las siguientes columnas:

|Columna         | Tipo | Rango             | Descripción|
|----------------|-----:|-------------------|-----------|
|Superficie      |float |50 - 150 m2        |Tamaño  |
|Habitaciones    |int   |1 - 5              |Número de habitaciones  |
|Antigüedad      |int   |0 - 50             |Años desde construcción  |
|Distancia_centro|float |1 - 20 km          |Distancia al centro  |
|Baños           |int   |1 - 3              |Número de baños  |
|Precio          |float |100 000 - 500 000 €|Precio estimado  |


<br>
<br>



## 🔍 Paso 2: Crear el modelo de predicción

Clase: **ModeloPrecioVivienda**. Esta clase representará el modelo de regresión lineal. Se encargará del entrenamiento, evaluación y predicción.

  + ✔️ Métodos obligatorios:

    + entrenar(data: pd.DataFrame):

      + Separa los datos en variables independientes y la variable objetivo (Precio).
      + Divide los datos en entrenamiento (80%) y prueba (20%).
      + Entrena un modelo de regresión lineal con scikit-learn.

    + evaluar():

      + Muestra el error cuadrático medio (MSE).
      + Muestra el coeficiente de determinación R².

    + predecir(nueva_vivienda: pd.DataFrame) -> float:

      + Recibe un DataFrame con las características de una vivienda.
      + Devuelve el precio estimado.

<br>
<br>

## 🧪 Paso 3: Probar todo en conjunto

Clase: **TestModeloPrecio**. Esta clase servirá como lanzador general para probar que todo funcione correctamente. Dentro del método ejecutar() debe:

  + 1.- Generar los datos usando SimuladorViviendas.

  + 2.- Entrenar y evaluar el modelo con ModeloPrecioVivienda.

  + 3.- Crear una vivienda de ejemplo (por ejemplo: superficie 120 m², 3 habitaciones, 10 años de antigüedad, 5 km al centro, 2 baños).

  + 4.- Imprimir el precio estimado.


<br>
<br>


## ✅ Requisitos técnicos

  + Usar pandas, numpy y scikit-learn (LinearRegression, train_test_split, mean_squared_error, r2_score).

  + Las clases deben estar bien documentadas.

  + El código debe poder ejecutarse de principio a fin sin errores.



## 🧪 Ejemplo de uso
```python
test = TestModeloPrecio()
test.ejecutar()
```

## Salida esperada
```python
Primeras filas de datos simulados:
    Superficie  Habitaciones  Antigüedad  Distancia_centro  Baños  \
0   87.454012             4          32          9.810270      3   
1  145.071431             3          39          7.713692      1   
2  123.199394             1           9         12.089466      2   
3  109.865848             4          42          2.476958      2   
4   65.601864             4          43         19.513501      2   

          Precio  
0  259267.477436  
1  314958.241175  
2  467942.246565  
3  238538.397746  
4  238781.280758  
Modelo entrenado correctamente.

Error Cuadrático Medio (MSE): 14748907009.71
R² del modelo: 0.02

El precio estimado de la vivienda es: $284,716.76
```

## Importación de librerías

In [52]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

## Definición de la clase SimuladorViviendas

In [53]:
class SimuladorViviendas:
    """
    Clase para simular datos de viviendas para un modelo de predicción de precios.

    Genera un conjunto de datos sintéticos utilizando pandas y numpy
    con características de viviendas y sus precios estimados.
    """
    def __init__(self, n=200, seed=42):
        """
        Inicializa la clase SimuladorViviendas.

        Args:
            n (int): El número de registros de viviendas a generar (por defecto es 200).
            seed (int): La semilla para el generador de números aleatorios (por defecto es 42).
                        Esto asegura la reproducibilidad de los datos generados.
        """

        self.n = n
        self.seed = seed
        self.df = None


    def generar_datos(self)-> pd.DataFrame:
        """
        Genera el DataFrame con los datos sintéticos de viviendas.

        El DataFrame generado contiene las siguientes columnas:
        - Superficie (float): Tamaño de la vivienda en m2.
        - Habitaciones (int): Número de habitaciones.
        - Antigüedad (int): Años desde la construcción.
        - Distancia_centro (float): Distancia al centro en km.
        - Baños (int): Número de baños.
        - Precio (float): Precio estimado de la vivienda en €.

        Returns:
            pd.DataFrame: Un DataFrame con los datos simulados de viviendas.
        """
        np.random.seed(0)
        self.df = pd.DataFrame()
        self.df['Superficie'] = np.random.uniform(50, 150, self.n)
        self.df['Habitaciones'] = np.random.randint(1, 6, self.n)
        self.df['Antigüedad'] = np.random.randint(0, 51, self.n)
        self.df['Distancia_centro'] = np.random.uniform(1, 21, self.n)
        self.df['Baños'] = np.random.randint(1, 4, self.n)
        # Fórmula simple para generar precios basados en las características
        self.df['Precio'] =  (self.df['Superficie'] * 1000) + (self.df['Habitaciones'] * 30000) + (self.df['Baños'] * 33333)- (self.df['Antigüedad'] * 1000) - (self.df['Distancia_centro'] * 3000)
        return self.df


In [54]:
sv = SimuladorViviendas(n= 5)
df = sv.generar_datos()
df.head()

Unnamed: 0,Superficie,Habitaciones,Antigüedad,Distancia_centro,Baños,Precio
0,104.88135,3,1,12.360891,2,223464.676727
1,121.518937,5,38,19.511933,3,274982.13834
2,110.276338,1,39,2.420721,1,127347.174115
3,104.488318,1,23,2.742586,3,203259.560318
4,92.36548,5,46,1.404368,1,225485.376087


## Definición de la clase ModeloPrecioVivienda

In [55]:
class ModeloPrecioVivienda:
  """
    Clase para representar un modelo de regresión lineal para la predicción del precio de viviendas.

    Se encarga del entrenamiento, evaluación y predicción utilizando scikit-learn.
  """
  def __init__(self):
    self.model = None
    self.scaler = None
    self.X_train = None
    self.feature_names = None
    self.X_train_scaled = None
    self.X_test = None
    self.X_test_scaled = None
    self.y_train = None
    self.y_test = None
    self.y_pred = None
    self.mse = None
    self.r2 = None

  def entrenar(self, data: pd.DataFrame):
    """
    Entrena el modelo de regresión lineal.

    Separa los datos en variables independientes (X) y la variable objetivo (y),
    divide los datos en conjuntos de entrenamiento y prueba (80/20), escala las
    características y entrena un modelo de regresión lineal.

    Args:
        data (pd.DataFrame): El DataFrame con los datos de viviendas, incluyendo
                              la columna 'Precio'.
    """
    # Separar variables independientes (X) y objetivo (y)
    X = data.drop('Precio', axis=1)
    y = data['Precio']

    # Dividir los datos en conjuntos de entrenamiento y prueba
    self.X_train, self.X_test, self.y_train, self.y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # Guardar los nombres de las columnas para usarlos después
    self.feature_names = self.X_train.columns

    # Inicializar y ajustar el scaler con los datos de entrenamiento
    self.scaler = StandardScaler()
    self.X_train_scaled = self.scaler.fit_transform(self.X_train)
    self.X_test_scaled = self.scaler.transform(self.X_test)

    # Inicializar y entrenar el modelo de regresión lineal con los datos escalados
    self.model = LinearRegression()
    self.model.fit(self.X_train, self.y_train)
    print("Modelo entrenado correctamente.")

  def evaluar(self):
    """
    Evalúa el modelo entrenado.

    Realiza predicciones en el conjunto de prueba escalado y calcula el
    Error Cuadrático Medio (MSE) y el coeficiente de determinación R².
    Imprime los resultados de la evaluación.
    """
    # Realizar predicciones en el conjunto de prueba escalado
    self.y_pred = self.model.predict(self.X_test)

    # Calcular métricas de evaluación
    self.mse = mean_squared_error(self.y_test, self.y_pred)
    self.r2 = r2_score(self.y_test, self.y_pred)

    # Imprimir resultados
    print(f"Error Cuadrático Medio (MSE): {self.mse}")
    print(f"R² del modelo: {self.r2}")

  def predecir(self, X_nueva_vivienda: pd.DataFrame) -> float:
    """
    Realiza una predicción del precio para una nueva vivienda.

    Recibe un DataFrame con las características de una nueva vivienda, lo escala
    utilizando el scaler entrenado y predice el precio utilizando el modelo entrenado.
    Convierte el array NumPy escalado de vuelta a un DataFrame antes de predecir.

    Args:
        nueva_vivienda (pd.DataFrame): DataFrame con las características de la nueva vivienda.
                                    Debe tener las mismas columnas que los datos de entrenamiento,
                                    en el mismo orden, excepto la columna 'Precio'.

    Returns:
        float: El precio estimado de la vivienda.
    """
    # Escalar la nueva vivienda
    X_nueva_vivienda_scaled = self.scaler.transform(X_nueva_vivienda)

    # Convertir el array NumPy escalado de vuelta a un DataFrame
    nueva_vivienda_scaled_df = pd.DataFrame(X_nueva_vivienda_scaled, columns=self.feature_names)

    # Realizar la predicción con el DataFrame escalado
    precio_estimado = self.model.predict(nueva_vivienda_scaled_df)[0]
    return precio_estimado

## Definición de la clase TestModeloPrecio

In [56]:
class TestModeloPrecio:
  def __init__(self):
    self.sv = SimuladorViviendas(n= 200)
    self.df = self.sv.generar_datos()
    self.mv = ModeloPrecioVivienda()
  def ejecutar(self):
    print("Primeras filas de datos simulados:")
    print(self.df.head())
    self.mv.entrenar(self.df)
    self.mv.evaluar()
    sv2 = SimuladorViviendas(n= 1)
    nueva_vivienda = sv2.generar_datos()
    X_nueva_vivienda = nueva_vivienda.drop('Precio', axis=1)
    precio_estimado = self.mv.predecir(X_nueva_vivienda)
    print(f"El precio estimado de la vivienda es: ${precio_estimado:.2f}")

## Ejemplo de uso

In [57]:
ejemplo = TestModeloPrecio()
ejemplo.ejecutar()

Primeras filas de datos simulados:
   Superficie  Habitaciones  Antigüedad  Distancia_centro  Baños  \
0  104.881350             3          19         18.345788      3   
1  121.518937             5          26         19.804194      1   
2  110.276338             4          14         16.015297      2   
3  104.488318             4          32         14.991501      2   
4   92.365480             2           6         20.359311      2   

          Precio  
0  220842.986065  
1  219439.355276  
2  234896.445894  
3  214179.814686  
4  151953.545938  
Modelo entrenado correctamente.
Error Cuadrático Medio (MSE): 3.663417496874849e-21
R² del modelo: 1.0
El precio estimado de la vivienda es: $-44601.14
