# Ejercicio - Busqueda de Alojamiento en Airbnb.

Supongamos que somos un agente de [Airbnb](http://www.airbnb.com) localizado en Lisboa, y tenemos que atender peticiones de varios clientes. Tenemos un archivo llamado `airbnb.csv` (en la carpeta data) donde tenemos información de todos los alojamientos de Airbnb en Lisboa.

In [2]:
import pandas as pd
df_airbnb = pd.read_csv("./src/airbnb.csv")

In [9]:
#df_airbnb.head()

In [10]:
#df_airbnb.dtypes

En concreto el dataset tiene las siguientes variables:
- room_id: el identificador de la propiedad
- host_id: el identificador del dueño de la propiedad
- room_type: tipo de propiedad (vivienda completa/(habitacion para compartir/habitación privada)
- neighborhood: el barrio de Lisboa
- reviews: El numero de opiniones
- overall_satisfaction: Puntuacion media del apartamento
- accommodates: El numero de personas que se pueden alojar en la propiedad
- bedrooms: El número de habitaciones
- price: El precio (en euros) por noche

## Usando Pandas

### Caso 1.

Alicia va a ir a Lisboa durante una semana con su marido y sus 2 hijos. Están buscando un apartamento con habitaciones separadas para los padres y los hijos. No les importa donde alojarse o el precio, simplemente quieren tener una experiencia agradable. Esto significa que solo aceptan lugares con más de 10 críticas con una puntuación mayor de 4. Cuando seleccionemos habitaciones para Alicia, tenemos que asegurarnos de ordenar las habitaciones de mejor a peor puntuación. Para aquellas habitaciones que tienen la misma puntuación, debemos mostrar antes aquellas con más críticas. Debemos darle 3 alternativas.

In [11]:
#--------------------------------------SOLUCION PARA EL CASO 1:------------------------------------------------

# promero se filtra los alojamientos para Alicia
alicias_options = df_airbnb[
    (df_airbnb['accommodates'] >= 4) &  # Para la familia de Alicia
    (df_airbnb['bedrooms'] >= 2) &  # Habitaciones separadas
    (df_airbnb['reviews'] > 10) &  # Más de 10 críticas
    (df_airbnb['overall_satisfaction'] > 4)  # Puntuación mayor de 4
]

# aqui se ordena x puntuacion/cantidadd de criticas 
alicias_options = alicias_options.sort_values(by=['overall_satisfaction', 'reviews'], ascending=[False, False])

# se escoge las mejores 3 opciones
top_3_options = alicias_options.head(3)

# mostramos als TOP-3 alternativas para Alicia
print(top_3_options[['room_id', 'room_type', 'neighborhood', 'overall_satisfaction', 'reviews', 'price']])


     room_id        room_type       neighborhood  overall_satisfaction  \
120   176153  Entire home/apt       Misericórdia                   5.0   
16     44043  Entire home/apt  Santa Maria Maior                   5.0   
140   202150  Entire home/apt  Santa Maria Maior                   5.0   

     reviews  price  
120      438  102.0  
16       316   80.0  
140      274   62.0  


### Caso 2

Roberto es un casero que tiene una casa en Airbnb. De vez en cuando nos llama preguntando sobre cuales son las críticas de su alojamiento. Hoy está particularmente enfadado, ya que su hermana Clara ha puesto una casa en Airbnb y Roberto quiere asegurarse de que su casa tiene más críticas que las de Clara. Tenemos que crear un dataframe con las propiedades de ambos. Las id de las casas de Roberto y Clara son 97503 y 90387  respectivamente. Finalmente guardamos este dataframe como excel llamado "roberto.xls

In [20]:
#--------------------------------------SOLUCION PARA EL CASO 2:------------------------------------------------

# ID de Roberto y Clara
roberto_id = 97503
clara_id = 90387

# se crea DataFrame para Roberto y Clara
roberto_properties = df_airbnb[df_airbnb['host_id'] == roberto_id]
clara_properties = df_airbnb[df_airbnb['host_id'] == clara_id]

# usamos concatenar los DataFrames de Roberto y Clara
roberto_clara_df = pd.concat([roberto_properties, clara_properties])

# se guerda el DataFrame como un archivo Excel 
roberto_clara_df.to_excel('roberto.xls', index=False, engine='openpyxl')

# se imprime el nuevo DataFrame
print(roberto_clara_df)


Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []



### Caso 3

Diana va a Lisboa a pasar 3 noches y quiere conocer a gente nueva. Tiene un presupuesto de 50€ para su alojamiento. Debemos buscarle las 10 propiedades más baratas, dandole preferencia a aquellas que sean habitaciones compartidas *(room_type == Shared room)*, y para aquellas viviendas compartidas debemos elegir aquellas con mejor puntuación.

In [21]:
#--------------------------------------SOLUCION PARA EL CASO 3:------------------------------------------------

# se filtr alojamientos para diana
diana_options = df_airbnb[
    (df_airbnb['accommodates'] >= 1) & 
    (df_airbnb['price'] <= 50) &  # Presupuesto de 50€
    (df_airbnb['room_type'] == 'Shared room')  # Preferencia por habitaciones compartidas
]

# Ordenar por precio y puntuación 
diana_options = diana_options.sort_values(by=['price', 'overall_satisfaction'], ascending=[True, False])

# se elige 10 opciones más baratas
top_10_options = diana_options.head(10)

#muestra 10 opciones para Diana
print(top_10_options[['room_id', 'host_id', 'room_type', 'neighborhood', 'overall_satisfaction', 'reviews', 'price']])


        room_id    host_id    room_type       neighborhood  \
1010    1179457    5799522  Shared room      Santo António   
3562    5557699   28812904  Shared room  Santa Maria Maior   
7584   13116032   72951043  Shared room            Arroios   
13148  19314160  135270245  Shared room        Santa Clara   
9065   14933182   91501272  Shared room      Santo António   
4353    6728244   28812904  Shared room  Santa Maria Maior   
5616    9317561   48360716  Shared room            Arroios   
6640   11693356   28812904  Shared room  Santa Maria Maior   
6641   11693442   28812904  Shared room  Santa Maria Maior   
8908   14708916   91501272  Shared room      Santo António   

       overall_satisfaction  reviews  price  
1010                    4.0       42   10.0  
3562                    4.0       22   10.0  
7584                    0.0        1   10.0  
13148                   0.0        0   10.0  
9065                    5.0        5   11.0  
4353                    4.5        8   11