## Ejercicio - Regresión Viviendas Barcelona

- Utilizando el dataset de publicaciones de venta de viviendas en Barcelona _**viviendas_barcelona.parquet**_, entrena un modelo de regresión lineal múltiple que sea capaz de calcular el precio de venta:

    - Antes de crear el modelo y entrenarlo, haz un **EDA** de los datos.
        - ¿Qué columnas pueden ser las más importantes?
        - ¿Como se distribuyen los precios?
        - ¿Qué columnas sería factible limpiar?
        - ¿Qué significan los **np.nan**?
     
    - Cuando entiendas bien los datos con los que estás tratando, puedes proceder a realizar un preprocesamiento:
        - Elimina duplicados.
        - Elimina columnas innecesarias
        - Trata los valores perdidos **np.nan**.
        - Maneja los outliers como consideres.
        - Realiza transformaciones a los datos que consideres necesarias.
        - Codifica los datos categóricos para que el modelo los entienda (pásalos a números).
        - Considera normalizar los datos antes de utilizarlos para el entreno.
        
    - Entrena el modelo con un subconjunto de 70-80% del dataset.
      
    - Utiliza los datos restantes para comprobar cómo de bueno es el modelo:
        - Calcula **R2**, **MAE** y **MSE**.
        
- Importa las librerías que vayas a necesitar.

In [1]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Modelo
from sklearn.linear_model import LinearRegression

# Herramientas de preprocesamiento
from sklearn.preprocessing import MinMaxScaler, LabelEncoder, TargetEncoder, OneHotEncoder

# Split
from sklearn.model_selection import train_test_split

# Métricas
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error

df = pd.read_parquet("../Data/viviendas_barcelona.parquet")

In [4]:
df.head()

Unnamed: 0,price,title,province,location,lat,lng,agency,updated,timestamp,id_1,...,Consumo,Habitaciones,Referencia,Antigüedad,Garaje,Terraza,Se aceptan mascotas,Ascensor,Tipo de casa,Superficie útil
0,52000.0,"Piso en venta en Avenida Casetes, nº 33",barcelona,"Avenida Casetes, nº 33. Centre Vila (Vilafranc...",41.34835,1.70197,Inmuebles de Aliseda Inmobiliaria,1672874000.0,1697761000000000.0,34241677924,...,A B C D E F G,3,ASR1-SRB0000036956,,,,,,,
1,315000.0,Casa adosada en venta en Vilafranca del Penedes,barcelona,Castellet i la Gornal,41.276503,1.652229,Inmuebles de Engel & Völkers Barcelona,1672701000.0,1697761000000000.0,23357117200,...,,4,IF76306-I-00VJM3-W-02OAMJ,,1.0,Terraza,,,Adosada,
2,650000.0,Casa unifamiliar en venta en Sant Sadurní d'Anoia,barcelona,Sant Sadurní d'Anoia,41.426682,1.79263,Inmuebles de SAFTI ESPAÑA,1674861000.0,169776100000000.0,32584643160,...,,5,SA3541-REF_11510,,2.0,Terraza,,,Unifamiliar,220 m²
3,315000.0,Casa en venta en Carrer de Sant Pere Molanta,barcelona,Carrer de Sant Pere Molanta. Olèrdola,41.318658,1.754891,Inmuebles de ALARCON PROPIEDADES,1673997000.0,1697761000000000.0,19202422630,...,,3,4017-4751,Entre 30 y 50 años,1.0,Terraza,Se aceptan mascotas,,,100 m²
4,209900.0,"Chalet en venta en Calle Carrer Serral Llarg, ...",barcelona,"Calle Carrer Serral Llarg, nº 107. Olesa de Bo...",41.3697,1.87677,Inmuebles de FINCAS MARINA,1674256000.0,1697761000000000.0,35859429926,...,,3,SA3007-08353,,,Terraza,,,,398 m²


In [8]:
df["agency"].nunique()

1329

Unnamed: 0,price,title,province,location,lat,lng,agency,updated,timestamp,id_1,...,Consumo,Habitaciones,Referencia,Antigüedad,Garaje,Terraza,Se aceptan mascotas,Ascensor,Tipo de casa,Superficie útil
138,,,barcelona,,,,,,1.697762e+15,25092950882,...,,,,,,,,,,
2437,,,barcelona,,,,,,1.697776e+15,32512388509,...,,,,,,,,,,
2746,,,barcelona,,,,,,1.697778e+15,32519223008,...,,,,,,,,,,
3207,,,barcelona,,,,,,1.697780e+14,37533178009,...,,,,,,,,,,
3370,,,barcelona,,,,,,1.697782e+15,37504941105,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
26904,,,barcelona,,,,,,1.697943e+15,37522279243,...,,,,,,,,,,
27066,,,barcelona,,,,,,1.697944e+14,37548656560,...,,,,,,,,,,
27114,,,barcelona,,,,,,1.697944e+15,36762306409,...,,,,,,,,,,
27193,,,barcelona,,,,,,1.697945e+15,37540936773,...,,,,,,,,,,
