# Conociendo el contenido

### Notas:
> - Este playbook require haber ejecutado "conversion-de-tipos"
> - El estudio se realizará sólo sobre viviendas de cualquier tipo

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
df = pd.read_pickle("data/propiedades.pkl")
df.dtypes

id                               int64
titulo                          object
descripcion                     object
tipodepropiedad               category
direccion                       object
ciudad                        category
provincia                     category
antiguedad                     float64
habitaciones                   float64
garages                        float64
banos                          float64
metroscubiertos                float64
metrostotales                  float64
idzona                          object
lat                            float64
lng                            float64
fecha                           object
gimnasio                          bool
usosmultiples                     bool
piscina                           bool
escuelascercanas                  bool
centroscomercialescercanos        bool
precio                         float64
dtype: object

In [3]:
df.shape

(240000, 23)

In [4]:
df=df.filter(items=[
    'id','tipodepropiedad','cuidad','provincia','habitaciones',
    'garages','banos','metroscubiertos','idzona','gimnasio',
    'usuamultiples','piscina','escuelascercanas',
    'centroscomercialescercanos','precio','antiguedad'
])

In [5]:
df.shape

(240000, 14)

In [6]:
df.tipodepropiedad.unique().tolist()

['Apartamento',
 'Casa en condominio',
 'Casa',
 'Terreno',
 'Terreno comercial',
 'Local Comercial',
 'Quinta Vacacional',
 'Oficina comercial',
 'Edificio',
 'Casa uso de suelo',
 'Local en centro comercial',
 'Bodega comercial',
 'Otros',
 'Villa',
 'Duplex',
 'Inmuebles productivos urbanos',
 'Departamento Compartido',
 'Nave industrial',
 'Rancho',
 'Terreno industrial',
 nan,
 'Huerta',
 'Lote',
 'Hospedaje',
 'Garage']

In [7]:
propiedades = [
    'Casa','Apartamento','Casa en condominio','Casa uso de suelo', 'Duplex'
]

In [8]:
# Ignora los warnings producto de dividir por NaN
# Expresa los precios en miles y las estadísticas a 2 decimales para hacer la lectura más simple 
with np.errstate(divide='ignore',invalid='ignore'):
    df.loc[:,'precio_miles_metroscubiertos'] = round(
        df.loc[:,'precio'] / df.loc[:,'metroscubiertos'] / 1000
    )

In [9]:
viviendasdf = df[df['tipodepropiedad'].isin(propiedades)].copy()
viviendasdf.shape

(219406, 15)

In [10]:
viviendasdf.head(3)

Unnamed: 0,id,tipodepropiedad,provincia,habitaciones,garages,banos,metroscubiertos,idzona,gimnasio,piscina,escuelascercanas,centroscomercialescercanos,precio,antiguedad,precio_miles_metroscubiertos
0,254099,Apartamento,Distrito Federal,2.0,1.0,2.0,80.0,23533,False,False,False,False,2273000.0,,28.0
1,53461,Casa en condominio,Distrito Federal,3.0,2.0,2.0,268.0,24514,False,False,True,True,3600000.0,10.0,13.0
2,247984,Casa,Jalisco,3.0,2.0,2.0,144.0,48551,False,False,False,False,1200000.0,5.0,8.0


In [11]:
analisis = viviendasdf.groupby(['tipodepropiedad']).describe()\
  .stack().drop(columns='id').unstack(0).stack()\
  .loc[:,['habitaciones','banos','garages','metroscubiertos','precio_miles_metroscubiertos']]

In [12]:
analisis.drop('count')

Unnamed: 0_level_0,Unnamed: 1_level_0,habitaciones,banos,garages,metroscubiertos,precio_miles_metroscubiertos
Unnamed: 0_level_1,tipodepropiedad,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
mean,Apartamento,2.386533,1.816817,1.410242,117.048657,22.404084
mean,Casa,3.09208,2.240429,1.705926,194.026911,11.176447
mean,Casa en condominio,2.957132,2.366065,1.908157,187.697231,13.931298
mean,Casa uso de suelo,4.284861,2.404719,1.42735,254.068966,14.339901
mean,Duplex,2.541176,1.360947,1.181548,100.215976,11.517751
std,Apartamento,0.630951,0.768021,0.749516,67.299715,12.76534
std,Casa,0.881185,0.933291,0.791163,98.515058,5.951779
std,Casa en condominio,0.611669,0.895555,0.68601,94.330711,6.930328
std,Casa uso de suelo,2.065912,0.948442,1.097525,96.619669,12.909646
std,Duplex,0.912747,0.67592,0.622766,71.034059,6.465245


## Conclusiones parciales
* Las casa de uso de suelo tienen características muy distintas al resto de las viviendas unifamiliares en cuanto a número de habitaciones y baños, no así en cuanto a garages
* El 25% de las casas de uso de suelo no cuentan con garages

* En promedio, los apartamentos tienen menos habitaciones que las casas pero tienen un precio superior.

* Existe un gupo de viviendas que corresponde a la cota superior al 75% que dista por mucho del 75% en cuanto a habitaciones, baños y garages. 
