# AirBnB Madrid

Uno de nuestros clientes opera en el mercado de inmuebles. Está especialmente
interesado en Madrid, donde posee una cantidad importante de viviendas
publicadas en la plataforma AirBnB y nos pide que le asesoremos respondiendo a
la siguiente pregunta:<br>
<br>

<div style="text-align:center; color:red; font-size:larger; font-weight:bold; border: 2px solid red; padding: 10px;">
    ¿Qué puedo hacer para optimizar el precio de mis viviendas?
</div>


El objetivo del proyecto será elaborar un Data Storytelling que de respuesta a
nuestro cliente siguiendo los siguientes pasos:

1. Elaborar un contexto del problema
2. Definir el problema que queremos resolver
3. Definir y desarrollar el roadmap del análisis
4. Recopilar los principales insights para montar el storytelling final:<br>
    - contexto
    - problema
    - insights

# **Contexto**:

Para obtener contexto sobre el caso que se planteo, se han descagado una serie de 6 datasets con datos de 50 variables en relacion a mas de 21.000 anuncios de airbnb:

Para realizar este proyecto se conto con el siguiente set de datos:

Descripción                                                                 |
|:----------------------------------------------------------------------------|
Información del propietario de cada vivienda.                               |
Información de la localización de cada vivienda.                            |
Información de la vivienda.                                                 |
Información de las condiciones de cada vivienda para poder alquilarla.      |
Información de las reseñas de cada vivienda.                                |




En un primer paso se han obtenido metricas, visualizaciones y algunas estadisticas que ayudan a entender mas en profundidad la informacion con la que se cuenta antes de terminar de plantear y avanzar con la problematica de fondo. Por ejemplo:

Se han encontrado 30 tipos distintos de propiedades:

'apartment', 'house', 'loft', 'guest_suite', 'chalet',
      'serviced_apartment', 'other', 'condominium', 'bed_and_breakfast',
       'townhouse', 'hut', 'hostel', 'aparthotel', 'villa', 'dome_house',
       'casa_particular_cuba_', 'guesthouse', 'boutique_hotel', 'hotel',
       'barn', 'tiny_house', 'camper_rv', 'farm_stay', 'tent', 'bungalow',
       'earth_house', 'pension_south_korea_', 'cave', 'nature_lodge',
       'igloo'
       
Se considera que sera irrelevante trabajar con tipo de propiedades distintas a las que tiene el cliente, en este caso apartamentos, ya que no se obtendrian resultados comparables.

Por otro lado, se encontro una distribucion de precios con la siguiente estructura:

**Estadística**                         | **Valor**
:--------------------------------------:|:---------------------------------------:
Media                                   | 131.33
Desviación estándar                     | 364.80 
Mínimo                                  | 1.00
Percentil 25 (Q1)                       | 40.00
Mediana (Percentil 50)                  | 65.00
Percentil 75 (Q3)                       | 102.00
Máximo                                  | 9999.00

![image.png](attachment:image.png)

Se encontraron precios muy dispares y en un rango demasiado amplio. Se considera incorrecto continuar con el analisis con esta dispersion de precios y desvio estandar.

Se concluyo que no todos los anuncios dentro del data set son comparables y aplicables para el caso en el que queremos trabajar. Es por eso que se opto por replantear el problema y nuestro scope de analisis.

# **Problema**:

Luego del primer aproach a los datos y sus metricas fue evidente que se necesitaba precisar mas sobre la consigna o pregunta que nos fue dada. 

Se necesita entender en concreto y en profundidad el objetivo y el alcance del problema. A que se refiere con "maximizar"y tambien entender cuan factible y hasta que punto es para el cliente hacer las modificaciones sugeridas al final del analisis.

Luego de algunos intercambios con el cliente se logro reformular la consigna inicial para dar arranque al proyecto. Se entendio que:

__El cliente esta buscando, mediante nuestro analisis y sugerencias, elaborar una estrategia de ajuste de precios de sus propiedades con el fin de tener un precio "coherente" de alquiler en relacion a sus servicios ofrecidos y acorde al mercado. Por otro lado, obtener insights de los factores y servicios que pueden influir para efectivamente subir o bajar los precios de sus alojamientos.__


 - Una vez definida la consigna, el analisis se centrara en buscar relaciones de los distintos factores y variables disponibles en el dataset con el precio de los alojamientos y cuales de estas tienen una influencia significativa en el.<br>
 - Se buscaran factores para dividir el analisis dentro de cada hipotesis. Por ejemplo el tipo de habitacion, donde, por lo general, cada tipo se ve afectada por el precio en distinta magnitud.<br>
 
 - Luego de otras aclaraciones del cliente, tambien se filtrara y acotara la informacion para hacer foco en datos comparables y obtener insights mas relevantes. Por ejemplo:<br>

   - Se dejaran solo alojamientos del tipo "apartamento", se eliminaran el resto del analisis ya que el cliente posee solo este tipo de propiedades.<br>
   <br>
   - Se trabajara solo con alojamientos entre 20 y 200 euros por noche, ya que el cliente confirma que actualmente sus alquileres rondan los 150 euros. Dejando una estructura de precios asi:
   
| **Estadística**              | **Valor**      |
|------------------------------|----------------|
| Media                        | 72.38      |
| Desviación estándar          | 41.16      |
| Mínimo                       | 20.00      |
| Percentil 25 (Q1)            | 40.00     |
| Mediana (Percentil 50)       | 65.00     |
| Percentil 75 (Q3)            | 95.00      |
| Máximo                       | 200.00    |

   - Estos filtros acotan el set, dejando aproximadamente 15.000 publicaciones.<br>


![image.png](attachment:image.png)

 - Tambien se agregaran algunas columnas que parecen de gran utilidad al momento de complementar el analisis:<br>
 
   - Precio por persona: dividiendo el precio por la cantidad maxima de huespedes del alojamiento, con el fin de "normalizar" el precio de los apartamentos y crear una medida mas comparable en algunos casos.



  - Para comenzar a analizar las variables en particular se plantearon algunas hipotesis las cuales, a priori, parecen dar informacion util para el cliente y su objetivo:

## Hipotesis:

 1. Influencia de amenidades en el precio
 2. Influencia de tipo de cama en el precio
 3. Influencia de la cantidad de habitaciones en el precio
 4. Influencia de la cercania del apartamento al centro o al aeropuerto, en el precio
 5. Influencia del barrio en el precio


# **Insights**:

## Hipotesis 1:
Influencia de amenidades en el precio

Amenidades:
 - Wifi internet
 - TV
 - Air Conditioning
 - Heating
 - Kitchen

1. Se dividio el analisis en los 3 tipos de habitaciones disponibles (Habitacion privada, Apartamento completo, y Habitacion compartida) ya que los precios no responden de igual manera a la variable.<br>
<br>
2. Para complementar este analisis se agrega como varia el rating de reviews al tener o no esta amenidad.


### __Habitacion privada:__

![image-2.png](attachment:image-2.png)

![image-2.png](attachment:image-2.png)

- En el caso de habitaciones privadas destacamos la importancia de tener aire acondicionado y TV, con un diferencial de precio de 23% y 13% respectivamente contra los que no tienen. Asi tambien la calefaccion, con un 9%.<br>
<br>
- Los reviews confirman firmemente que las habitaciones privadas con estas amenidades tienen mayores precios y estan mejor valoradas por los huespedes que las que no.

### __Apartamento completo:__

![image-2.png](attachment:image-2.png)

![image.png](attachment:image.png)

- En el caso de apartamentos completos, vemos que se comporta de manera similar a las habitaciones privadas, pero tambien destacamos la importancia de tener WIFI, ya que aporta un diferencial de precio positivo de 13%.<br>
<br>
- Los reviews confirman este diferencial de precio. Y se observa como son penalizadas las que no tienen la amenidad.

### __Habitacion compartida:__
En este caso se usara precio por persona

![image.png](attachment:image.png)

![image.png](attachment:image.png)

- En el caso de habitacion compartida se decidio optar por analizar el precio por persona y no el total del alojamiento para tener una vision mas clara de como afecta al precio marginal del alquiler de la habitacion.<br>
<br>
- En el caso de TV y WIFI vemos que en este tipo de habitaciones, no afecta el precio del alquiler. Aunque no se considera que el hecho de tenerlas afecte negativamente al precio, pero evidentemente no es tan capitalizable como el resto de amenidades y no tanto como en el otro tipo de alojamientos.<br>
<br>
- Para el resto de amenidades, aquellos alojamientos  que las poseen tienen un precio promedio 10% más alto que los que no.<br>
<br>
- Los reviews nos hablan claramente que tener las amenidades es premiado significativamente con mejores reviews contra no tenerlas.


## Apuntes y recomendaciones sobre la hipotesis 1:
- En general, mas alla del tipo de habitacion que se oferte en el alojamiento, es altamente recomendable incorporar este tipo de amenidades al alojamiento. Esto habilitara la posibilidad de ajustar el precio positivamente y maximizar el ingreso.<br>
<br>
- Por otro lado, se deberia ajustar a la baja en caso de no tener algunas de las condiciones mencionadas anteriormente ya que se maximizaria la cantidad de huespedes que elijen el alojamiento por estar en un precio justo. Estos ajustes haran mas eficiente la politica de precio y maximizara el rendimiento total del alojamiento.<br>
<br>
- Por otro lado, se ve que estos precios marginales superiores al tener amenidades esta validado por el rating promedio de los alojamientos, siendo significativamente superior a hospedajes sin ellas, lo que nos muetsra una mayor aceptacion de precios superiores en alojamientos con ciertas amenidades.<br>
<br>
- Como ultima sugerencia, en el caso de tener que elegir una sola amenidad para incorporar en las propiedades, se considera que el aire acondicionado es la mas adecuada, siendo la que mayor diferencial, tanto de precio, como de reviews, denota; seguido por una TV y WIFI.<br>
<br>
- Estas conclusiones aplican como regla general para todos los grupos de barrios de Madrid, ya que no hay una clara o significativa diferencia entre ellos.


## Hipotesis 2:
Influencia de tipo de cama en el precio

Tipos de cama:
- Cama
- Sofá cama
- Futon
- Sofá
- Colchon inflable

1. Se dividio el analisis en los 3 tipos de habitaciones disponibles (Habitacion privada, Apartamento completo, y Habitacion compartida) ya que los precios no responden de igual manera a la variable.<br>
<br>
1. Para complementar este analisis se agrega como varia el rating de reviews al tener o no esta amenidad.<br>
<br>
1. Se omitira el analisis con colchon inflable ya que la cantidad de datos que hay y los insights que aportan no son fiables ni significativos. Practicamente ningun alojamiento opta por este tipo de cama.

### __Habitacion privada:__

![image.png](attachment:image.png)

![image.png](attachment:image.png)

- En el caso de las habitaciones privadas, la diferencia de precio segun el tipo de cama no produce ningun efecto significativo en los precios. Los precios se ubican en mismos valores para los principales tipos.
- Cuando observamos los reviews tambien se puede concluir que en este tipo de habitacion, el tipo de cama no produce ningun efecto significativo.

### __Apartamento completo:__

![image.png](attachment:image.png)

![image.png](attachment:image.png)

 - En el caso de los alojamientos completos, hay una clara diferencia de precio positiva entre los que tienen cama normal contra los que tienen otro tipo de cama. El precio se ubica un 32% por encima del sofa cama, y un 46% por encima del futon.
 - En cuanto a las reviews, la cama y el sofa cama obtienen las mejores puntuaciones mientras que el futon los peores resultados. 

### __Habitacion compartida:__

![image.png](attachment:image.png)

![image.png](attachment:image.png)

 - En el caso de las habitaciones compartidas, hay una clara diferencia de precio positiva para los que tienen cama y no otro tipo. El precio se ubica un 17% por encima del sofa.
- Cuando observamos los reviews se puede concluir que en este tipo de habitacion, el tipo de cama no produce ningun efecto significativo en los reviews.

## Apuntes y recomendaciones sobre la hipotesis 2:
 - En terminos generales, podemos encontrar un mayor diferencial de precio positivo cuando el alojamiento posee camas normales sobre cualquier otro tipo.<br>
<br>
- Por ello, se sugiere que, de ser posible, siempre se opte por ofrecer una cama normal, y en caso de no poder reemplazarlo por cuestiones de espacio o area, se recomienda cambiar futones por sofa cama. Esto habilitara el diferencial de precio que se da con este factor.


## Hipotesis 3:
Influencia de la cantidad de habitaciones en el precio

- Se dividio el analisis en  2 tipos de habitaciones principales (Habitacion privada, Apartamento completo) se omitira el analisis de habitacion compartida ya que en este caso  sus datos no son precisos.
- Se comienza por analizar la distribucion de cantidad de apartamentos segun las habitaciones que tenga. Esto da un primer entendimiento de como se distribuye la oferta, variable que tiene ingerencia sobre los precios.
- Para el resto del analisis se omitiran alojamientos con mas de 4 habitaciones por su poca representatividad en la muestra y poca precision de los datos.

![image.png](attachment:image.png)

| Habitaciones |   %  |
|--------------|-------|
| 0         | 6.81% |
| 1         | 62.64% |
| 2         | 22.49% |
| 3          | 6.51% |
| 4          | 1.27% |
| 5          | 0.23% |
| 6          | 0.05% |
| 8          | 0.01% |

### __Habitacion privada:__

![image-2.png](attachment:image-2.png)

### __Apartamento entero:__

![image-2.png](attachment:image-2.png)

### __Precio por persona vs cantidad de habitaciones:__
Tener en cuenta que se comporta de igual manera para ambos tipo de habitacion (Habitacion privada y alojamiento entero)

![image-2.png](attachment:image-2.png)

## Apuntes y recomendaciones sobre la hipotesis 3:
- Se puede observar que cuando el hospedaje se alquila por habitacion privada, los diferenciales de precio entre 0 y 1 habitacion son practicamente nulas, pero cuando pasamos a 2 habitaciones el diferencial es superior al 30%.
- Cuando se alquila por hospedaje entero los precios se comportan de una manera mas "logica", mientras mas habitaciones tenga el hospedaje, mayor precio tiene.
- Si se tuviese un apartamento de 1 habitacion es conveniente alquilarlo completo y no por habitacion para maximizar el ingreso del alojamiento. En alojamientos con mas habitaciones se entiende que el precio de alquilarlo como habitacion privada se multiplica por la cantidad de habitaciones que tenga.
- No funciona de la misma manera con propiedades de 2 habitaciones, donde el precio de alquiler es un 50% mayor que un studio y casi un 30% que uno de 1 habitacion. Pero donde los precios por persona en el alojamiento son practicamente iguales a alojamientos de 1 habitacion.
- Si se tuviese un studio, es muy importante indicar que se ofrece  un apartamento completo, ya que por "habitacion", aunque no tenga, los precios son mucho menores que cuando se ofertan como alojamiento completo. Con esto tambien se podria ajustar el precio al alza.<br>
<br>
- Por otro lado, se puede concluir que ante la oportunidad de adquirir un nuevo piso de alquiler para disposicion total del huesped, quizas sea preferible optar por un studio (0 habitaciones), ya que solo tiene un diferencial negativo de precio de alquiler de 15% aproximadamente contra pisos de 1 habitacion. Considerando que la diferencia de precio de compra de los pisos de 1 habitacion contra los studios seguramente sea mayor a este porcentaje, la tasa de rendimiento de los studios se encontraria por encima. 


## Hipotesis 4:
Influencia de la cercania del apartamento al centro o al aeropuerto, en el precio
- Se analizara la distribucion de los precios en funcion de la distancia a Sol y la distancia al aeropuerto.
- En este caso no se discriminara por tipo de habitacion ya que no genera valor agregado al analisis.

![image.png](attachment:image.png)

- En este primer grafico se ha marcado un cuadrado rojo donde se puede observar que hay menor concentracion de alojamientos. Esto significa que cuando el apartamento se ubica a mas de 6km de distancia de Sol, no es tan factible que supere un precio de 100. Pero si se observa a la izquierda del cuadrado, donde la distancia es menor a 6km, los precios se distribuyen mas uniformemente a lo largo de todo el rango de precios, ubicandose, muchos, por encima de 100.
- Los apartamentos que se encuentran por debajo del cuadrado, donde hay un poco mas de concentracion, tienen un precio inferior a 100.<br>
<br>
- Para entender mejor esto, se ha calculado la media de precios para apartamentos a mas de 6km de Sol y a menos:

Precio medio para distancia mayor a 6km de Sol    59.14<br>
<br>
Precio medio para distancia menor a 6km de Sol    74.58<br>
<br>
- Podemos observar que hay un diferencial de precios de 26.1% positivo por estar a menos de 6km de Sol. Este factor es crucial al momento de definir los precios del apartamento.

![image.png](attachment:image.png)

- En este segundo grafico se puede observar que donde mas concentracion de apartamentos y mayores precios hay es dentro del rango de 11km y 16km aproximadamente. Esto quiere decir claramente que estar cerca del aeropuerto, por lo menos para el tipo de alojamiento "apartamentos", no permite un mayor precio por este factor. Esto se puede ver mas claro con los siguientes numeros:

Precio medio para distancia mayor a 6km del aeropuerto: 72.56<br>
<br>
Precio medio para distancia menor a 6km del aeropuerto: 52.78<br>
<br>

- Podemos observar que hay un diferencial de precios de -27.27% por estar a menos de 6km del aeropuerto. Teniendo en cuenta que el rango de distancia mencionado es justamente la distancia a Sol o al centro de la ciudad, por lo que confirma aun mas el analisis anterior, donde estar cerca de Sol es un gran factor a tener en cuenta al momento de ajustar el precio positivamente.

## Apuntes y recomendaciones sobre la hipotesis 4:
En este último análisis se pudo ver claramente como el hecho de estar a menos de 6km de Sol es un factor determinante para estar en un rango de precios superior a los alojamientos que se encuentran mas lejos.<br>
<br>
Como sugerencia, consideramos que si las propiedades se encuentran a menos de 6km de Sol, esto se tenga en cuenta al momento de fijar un precio, ya que los apartamentos que se encuentran “cerca” tienen en promedio un precio medio superior en 26% contra los que están mas “lejos”. Queda en evidencia que es un factor que se puede capitalizar con facilidad.<br>
<br> 
No sucede lo mismo con la distancia al aeropuerto, que se pudo ver en el grafico que la dispersión se concentraba en el rango de distancia en el que se encuentra Sol, el centro de la ciudad. Esto quizás se deba, en parte, al tipo de propiedad, el análisis seria otro si se analizaran hoteles por ejemplo. Es mas, se podría considerar que un apartamento cerca del aeropuerto debería tener un diferencial de precio negativo con respecto a uno mas cerca del centro. 


## Hipotesis 5:
Influencia del barrio en el precio

 - Aqui se analizara la distribucion de precios que hay en los alojamientos segun la zona en la que se encuentre.
 - El primer grafico muestra los precios medios en cada barrio, y luego se vera como se distribuyen con un grafico un poco mas detallado, pero con igual orden.
 - Marcada con una linea roja, se encuentra la media de precios totales.

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

- Los graficos anteriores son de gran utilidad para definir una buena estrategia de precios y llegar a un precio adecuado de los apartamentos en posesion segun la zona en la que se encuentran. Esto tambien facilita la comparativa con el resto del mercado.<br>
<br>
- Por otro lado, estos graficos dan informacion muy importante al momento de adquirir una nueva propiedad para alquiler. Analizando el mercado inmobiliario del momento y encontrando alguna oportunidad, se podria buscar maximizar la relacion coste/beneficio en algun barrio con precios superiores a la media. Sin duda que ubicarse en estas propiedades, traera mayores beneficios al largo plazo.

# Conclusiones y recomendaciones finales:
1.	Es de suma importancia para asegurarse de maximizar los precios y que sean convalidados por el mercado, el hecho de tener las amenidades mencionadas en este análisis. Hay ciertas de ellas que son mas necesarias dependiendo de la modalidad de habitación que se oferte, pero como regla general, tener estas amenidades habilita a tener un precio mayor que apartamentos que no las tengan.
Esto se ve confirmado por el valor de los reviews que aportan los inquilinos, siendo muy superiores para los que poseen estas comodidades.<br>
<br>
    - Las 3 mas importantes a incorporar son: Aire acondicionado, wifi y TV.<br>
<br>
2.	El hecho de ofertar una cama real en alquileres de alojamiento completo afecta significativamente al precio. Dándole un diferencial positivo de entre 30% y 45% sobre otros tipos de cama. Para el resto de las modalidades de habitación, esta diferencia no se aprecia, ni es determinante.
Los reviews nos indican también la importancia de la cama normal en alojamientos completos.<br>
<br>
    - Se recomienda dentro de lo posible siempre tener cama normal o en su defecto sofá cama, el cual sigue siendo mas apreciado que el resto de las opciones.<br>
<br>
3. 	Si se tuviese pisos studio y de 1 habitación, es recomendable alquilar el apartamento completo y no por habitación, ya que el precio convalidado por esta modalidad es mayor que por habitación privada.
No funciona de la misma manera con propiedades de 2 habitaciones, donde el precio de alquiler es un 50% mayor que un estudio y casi un 30% que uno de 1 habitación. Pero donde los precios por persona en el alojamiento son prácticamente iguales a alojamientos de 1 habitación.<br>
<br>
4. 	Los apartamentos que están a menos de 6km de Sol tienen un diferencial de precio positivo de 26% sobre lo que están mas lejos.
No pasa lo mismo con la distancia al aeropuerto, siendo esta diferencia negativa en un -27%<br>
<br>
5. 	Por ultimo y por fuera de la consigna inicial, luego de transcurrido el análisis y como resultado de este, se han obtenido algunos insights que se consideran útiles para el momento de nuevas adquisiciones de apartamentos en Madrid:<br>
<br>
    - Es significativo para maximizar precios, el hecho de que este se encuentre en un radio de 6km de Sol, donde se concentran los apartamentos con precios mas altos.
    - Siguiendo esta línea, se puede ver la lista de barrios con mayores precios medios de la ciudad, pero se considera importante que este en los barrios que se ubican por encima de la media de precios total. Esto maximizara el ingreso y rendimientos a largo plazo. También mantendrá un alto nivel de reventa y apreciación.
    - Entrando en lo particular, se sugiere optar por un estudio (0 habitaciones), ya que solo tiene un diferencial negativo de precio de alquiler de 15% aproximadamente contra pisos de 1 habitación. Considerando que la diferencia de precio de compra de los pisos de 1 habitación contra los estudios seguramente sea mayor a este porcentaje, la relación coste/beneficio seria mayor. 
En su defecto también sugerimos apartamentos de dos habitaciones, ya que el diferencial positivo de precio contra 1 habitacion es de 30% y 50% contra estudios. Esta de mas decir que habría que ponerlo en perspectiva con los precios de compra de los inmuebles.
