# Ejercicio - Busqueda de Alojamiento en Airbnb.

Supongamos que somos un agente de [Airbnb](http://www.airbnb.com) localizado en Lisboa, y tenemos que atender peticiones de varios clientes. Tenemos un archivo llamado `airbnb.csv` (en la carpeta data) donde tenemos información de todos los alojamientos de Airbnb en Lisboa.

In [3]:
import pandas as pd
df_airbnb = pd.read_csv("./data/airbnb.csv")

Pyarrow will become a required dependency of pandas in the next major release of pandas (pandas 3.0),
(to allow more performant data types, such as the Arrow string type, and better interoperability with other libraries)
but was not found to be installed on your system.
If this would cause problems for you,
please provide us feedback at https://github.com/pandas-dev/pandas/issues/54466
        
  import pandas as pd


In [4]:
df_airbnb.head()

Unnamed: 0,room_id,host_id,room_type,neighborhood,reviews,overall_satisfaction,accommodates,bedrooms,price
0,6499,14455,Entire home/apt,Belém,8,5.0,2,1.0,57.0
1,17031,66015,Entire home/apt,Alvalade,0,0.0,2,1.0,46.0
2,25659,107347,Entire home/apt,Santa Maria Maior,63,5.0,3,1.0,69.0
3,29248,125768,Entire home/apt,Santa Maria Maior,225,4.5,4,1.0,58.0
4,29396,126415,Entire home/apt,Santa Maria Maior,132,5.0,4,1.0,67.0


In [5]:
df_airbnb.dtypes

room_id                   int64
host_id                   int64
room_type                object
neighborhood             object
reviews                   int64
overall_satisfaction    float64
accommodates              int64
bedrooms                float64
price                   float64
dtype: object

En concreto el dataset tiene las siguientes variables:
- room_id: el identificador de la propiedad
- host_id: el identificador del dueño de la propiedad
- room_type: tipo de propiedad (vivienda completa/(habitacion para compartir/habitación privada)
- neighborhood: el barrio de Lisboa
- reviews: El numero de opiniones
- overall_satisfaction: Puntuacion media del apartamento
- accommodates: El numero de personas que se pueden alojar en la propiedad
- bedrooms: El número de habitaciones
- price: El precio (en euros) por noche

## Usando Pandas

### Caso 1.

Alicia va a ir a Lisboa durante una semana con su marido y sus 2 hijos. Están buscando un apartamento con habitaciones separadas para los padres y los hijos. No les importa donde alojarse o el precio, simplemente quieren tener una experiencia agradable. Esto significa que solo aceptan lugares con más de 10 críticas con una puntuación mayor de 4. Cuando seleccionemos habitaciones para Alicia, tenemos que asegurarnos de ordenar las habitaciones de mejor a peor puntuación. Para aquellas habitaciones que tienen la misma puntuación, debemos mostrar antes aquellas con más críticas. Debemos darle 3 alternativas.

In [7]:
# Filtrar habitaciones con más de 10 críticas y puntuación mayor de 4
filtered_rooms = df_airbnb[(df_airbnb['reviews'] > 10) & (df_airbnb['overall_satisfaction'] > 4)]

# Ordenar habitaciones por puntuación y número de críticas
sorted_rooms = filtered_rooms.sort_values(by=['overall_satisfaction', 'reviews'], ascending=[False, False])

# Seleccionar las tres mejores opciones
top_three_options = sorted_rooms.head(3)

# Mostrar las tres mejores opciones
print(top_three_options)


     room_id  host_id        room_type   neighborhood  reviews  \
120   176153   842219  Entire home/apt   Misericórdia      438   
931  1085634  5968047  Entire home/apt   Misericórdia      379   
212   299321   199452  Entire home/apt  Santo António      337   

     overall_satisfaction  accommodates  bedrooms  price  
120                   5.0             4       2.0  102.0  
931                   5.0             2       1.0   52.0  
212                   5.0             2       1.0   87.0  


### Caso 2

Roberto es un casero que tiene una casa en Airbnb. De vez en cuando nos llama preguntando sobre cuales son las críticas de su alojamiento. Hoy está particularmente enfadado, ya que su hermana Clara ha puesto una casa en Airbnb y Roberto quiere asegurarse de que su casa tiene más críticas que las de Clara. Tenemos que crear un dataframe con las propiedades de ambos. Las id de las casas de Roberto y Clara son 97503 y 90387  respectivamente. Finalmente guardamos este dataframe como excel llamado "roberto.xls

In [9]:
# Filtrar las propiedades de Roberto y Clara
roberto_id = 97503
clara_id = 90387

roberto_properties = df_airbnb[df_airbnb['host_id'] == roberto_id]
clara_properties = df_airbnb[df_airbnb['host_id'] == clara_id]

# Combinar los DataFrames de Roberto y Clara
combined_df = pd.concat([roberto_properties, clara_properties])

# Guardar el DataFrame combinado como un archivo Excel
combined_df.to_excel("roberto.xls", index=False)

print("DataFrame guardado como roberto.xls")

ValueError: No engine for filetype: 'xls'


### Caso 3

Diana va a Lisboa a pasar 3 noches y quiere conocer a gente nueva. Tiene un presupuesto de 50€ para su alojamiento. Debemos buscarle las 10 propiedades más baratas, dandole preferencia a aquellas que sean habitaciones compartidas *(room_type == Shared room)*, y para aquellas viviendas compartidas debemos elegir aquellas con mejor puntuación.

In [10]:
# Filtrar propiedades según el presupuesto y el tipo de habitación
budget = 50
shared_rooms = df_airbnb[(df_airbnb['price'] <= budget) & (df_airbnb['room_type'] == 'Shared room')]

# Ordenar las habitaciones compartidas por puntuación
sorted_shared_rooms = shared_rooms.sort_values(by='overall_satisfaction', ascending=False)

# Seleccionar las 10 mejores opciones
top_10_shared_rooms = sorted_shared_rooms.head(10)

# Mostrar las 10 mejores opciones
print(top_10_shared_rooms)

       room_id   host_id    room_type    neighborhood  reviews  \
6527  11523225  58899339  Shared room  Avenidas Novas        4   
6056  10397682  32344156  Shared room    Misericórdia       15   
7932  13570032  78249982  Shared room    Misericórdia        8   
7552  13078189  72524317  Shared room           Ajuda        7   
7313  12826411   6981742  Shared room        Alvalade       12   
7312  12826213   6981742  Shared room        Alvalade       19   
3727   5803348  29676067  Shared room    Misericórdia       19   
3663   5725814  29676067  Shared room    Misericórdia       23   
7066  12305540  66077974  Shared room         Arroios       40   
8918  14719962  40574313  Shared room  Avenidas Novas        4   

      overall_satisfaction  accommodates  bedrooms  price  
6527                   5.0             9       1.0   23.0  
6056                   5.0             8       1.0   13.0  
7932                   5.0            10       1.0   48.0  
7552                   5.0       