# Ejercicio - Busqueda de Alojamiento en Airbnb.

Supongamos que somos un agente de [Airbnb](http://www.airbnb.com) localizado en Lisboa, y tenemos que atender peticiones de varios clientes. Tenemos un archivo llamado `airbnb.csv` (en la carpeta data) donde tenemos información de todos los alojamientos de Airbnb en Lisboa.

In [3]:
import pandas as pd
df_airbnb = pd.read_csv("./data/airbnb.csv")

In [4]:
df_airbnb.head()

Unnamed: 0,room_id,host_id,room_type,neighborhood,reviews,overall_satisfaction,accommodates,bedrooms,price
0,6499,14455,Entire home/apt,Belém,8,5.0,2,1.0,57.0
1,17031,66015,Entire home/apt,Alvalade,0,0.0,2,1.0,46.0
2,25659,107347,Entire home/apt,Santa Maria Maior,63,5.0,3,1.0,69.0
3,29248,125768,Entire home/apt,Santa Maria Maior,225,4.5,4,1.0,58.0
4,29396,126415,Entire home/apt,Santa Maria Maior,132,5.0,4,1.0,67.0


In [5]:
df_airbnb.dtypes

room_id                   int64
host_id                   int64
room_type                object
neighborhood             object
reviews                   int64
overall_satisfaction    float64
accommodates              int64
bedrooms                float64
price                   float64
dtype: object

En concreto el dataset tiene las siguientes variables:
- room_id: el identificador de la propiedad
- host_id: el identificador del dueño de la propiedad
- room_type: tipo de propiedad (vivienda completa/(habitacion para compartir/habitación privada)
- neighborhood: el barrio de Lisboa
- reviews: El numero de opiniones
- overall_satisfaction: Puntuacion media del apartamento
- accommodates: El numero de personas que se pueden alojar en la propiedad
- bedrooms: El número de habitaciones
- price: El precio (en euros) por noche

## Usando Pandas

### Caso 1.

Alicia va a ir a Lisboa durante una semana con su marido y sus 2 hijos. Están buscando un apartamento con habitaciones separadas para los padres y los hijos. No les importa donde alojarse o el precio, simplemente quieren tener una experiencia agradable. Esto significa que solo aceptan lugares con más de 10 críticas con una puntuación mayor de 4. Cuando seleccionemos habitaciones para Alicia, tenemos que asegurarnos de ordenar las habitaciones de mejor a peor puntuación. Para aquellas habitaciones que tienen la misma puntuación, debemos mostrar antes aquellas con más críticas. Debemos darle 3 alternativas.

In [6]:
import pandas as pd

# Cargar el dataset
df_airbnb = pd.read_csv("./data/airbnb.csv")

# Filtrar el dataset
df_filtered = df_airbnb[(df_airbnb['reviews'] > 10) & (df_airbnb['overall_satisfaction'] > 4)]

# Ordenar el dataset
df_sorted = df_filtered.sort_values(by=['overall_satisfaction', 'reviews'], ascending=[False, False])

# Seleccionar las tres mejores opciones
top_three = df_sorted.head(3)

# Mostrar las tres mejores opciones
print("Las tres mejores opciones de alojamiento para Alicia son:")
print(top_three[['room_id', 'room_type', 'neighborhood', 'reviews', 'overall_satisfaction', 'accommodates', 'bedrooms', 'price']])


Las tres mejores opciones de alojamiento para Alicia son:
     room_id        room_type   neighborhood  reviews  overall_satisfaction  \
120   176153  Entire home/apt   Misericórdia      438                   5.0   
931  1085634  Entire home/apt   Misericórdia      379                   5.0   
212   299321  Entire home/apt  Santo António      337                   5.0   

     accommodates  bedrooms  price  
120             4       2.0  102.0  
931             2       1.0   52.0  
212             2       1.0   87.0  


### Caso 2

Roberto es un casero que tiene una casa en Airbnb. De vez en cuando nos llama preguntando sobre cuales son las críticas de su alojamiento. Hoy está particularmente enfadado, ya que su hermana Clara ha puesto una casa en Airbnb y Roberto quiere asegurarse de que su casa tiene más críticas que las de Clara. Tenemos que crear un dataframe con las propiedades de ambos. Las id de las casas de Roberto y Clara son 97503 y 90387  respectivamente. Finalmente guardamos este dataframe como excel llamado "roberto.xls

In [9]:
import pandas as pd

# Cargar el dataset completo
df_airbnb = pd.read_csv("./data/airbnb.csv")

# Filtrar las propiedades de Roberto y Clara
df_roberto_clara = df_airbnb[df_airbnb['room_id'].isin([97503, 90387])]

# Guardar el DataFrame como un archivo Excel
df_roberto_clara.to_csv("roberto.csv", index=False)

print("El DataFrame con las propiedades de Roberto y Clara ha sido guardado como 'roberto.csv'.")


El DataFrame con las propiedades de Roberto y Clara ha sido guardado como 'roberto.csv'.



### Caso 3

Diana va a Lisboa a pasar 3 noches y quiere conocer a gente nueva. Tiene un presupuesto de 50€ para su alojamiento. Debemos buscarle las 10 propiedades más baratas, dandole preferencia a aquellas que sean habitaciones compartidas *(room_type == Shared room)*, y para aquellas viviendas compartidas debemos elegir aquellas con mejor puntuación.

In [10]:
import pandas as pd

# Cargar el dataset completo
df_airbnb = pd.read_csv("./data/airbnb.csv")

# Filtrar propiedades dentro del presupuesto de Diana
df_filtered = df_airbnb[df_airbnb['price'] <= 50]

# Separar propiedades en habitaciones compartidas y viviendas completas
df_shared_rooms = df_filtered[df_filtered['room_type'] == 'Shared room']
df_entire_homes = df_filtered[df_filtered['room_type'] != 'Shared room']

# Ordenar habitaciones compartidas por precio y puntuación
df_shared_rooms = df_shared_rooms.sort_values(by=['price', 'overall_satisfaction'], ascending=[True, False])

# Ordenar viviendas completas solo por precio
df_entire_homes = df_entire_homes.sort_values(by='price', ascending=True)

# Combinar resultados de habitaciones compartidas y viviendas completas
df_combined = pd.concat([df_shared_rooms, df_entire_homes])

# Seleccionar las 10 propiedades más baratas
top_10_properties = df_combined.head(10)

# Mostrar las 10 propiedades más baratas
print("Las 10 propiedades más baratas para Diana en Lisboa son:")
print(top_10_properties[['room_id', 'room_type', 'neighborhood', 'price', 'overall_satisfaction']])


Las 10 propiedades más baratas para Diana en Lisboa son:
        room_id    room_type       neighborhood  price  overall_satisfaction
1010    1179457  Shared room      Santo António   10.0                   4.0
3562    5557699  Shared room  Santa Maria Maior   10.0                   4.0
7584   13116032  Shared room            Arroios   10.0                   0.0
13148  19314160  Shared room        Santa Clara   10.0                   0.0
9065   14933182  Shared room      Santo António   11.0                   5.0
4353    6728244  Shared room  Santa Maria Maior   11.0                   4.5
5616    9317561  Shared room            Arroios   11.0                   4.5
6640   11693356  Shared room  Santa Maria Maior   11.0                   4.5
6641   11693442  Shared room  Santa Maria Maior   11.0                   4.5
8908   14708916  Shared room      Santo António   11.0                   4.5
