# **Ejercicio - Busqueda de Alojamiento en Airbnb.**

Supongamos que somos un agente de Airbnb localizado en Lisboa, y tenemos que atender peticiones de varios clientes. Tenemos un archivo llamado airbnb.csv (en la carpeta Datos) donde tenemos información de todos los alojamientos de Airbnb en Lisboa.

In [2]:
pip install pandas

Note: you may need to restart the kernel to use updated packages.


In [3]:
import pandas as pd
df_airbnb = pd.read_csv("./Datos/airbnb.csv")

In [4]:
df_airbnb.head()

Unnamed: 0,room_id,host_id,room_type,neighborhood,reviews,overall_satisfaction,accommodates,bedrooms,price
0,6499,14455,Entire home/apt,Belém,8,5.0,2,1.0,57.0
1,17031,66015,Entire home/apt,Alvalade,0,0.0,2,1.0,46.0
2,25659,107347,Entire home/apt,Santa Maria Maior,63,5.0,3,1.0,69.0
3,29248,125768,Entire home/apt,Santa Maria Maior,225,4.5,4,1.0,58.0
4,29396,126415,Entire home/apt,Santa Maria Maior,132,5.0,4,1.0,67.0


In [5]:
df_airbnb.dtypes

room_id                   int64
host_id                   int64
room_type                object
neighborhood             object
reviews                   int64
overall_satisfaction    float64
accommodates              int64
bedrooms                float64
price                   float64
dtype: object

En concreto el dataset tiene las siguientes variables:
- room_id: el identificador de la propiedad
- host_id: el identificador del dueño de la propiedad
- room_type: tipo de propiedad (vivienda completa/(habitacion para compartir/habitación privada)
- neighborhood: el barrio de Lisboa
- reviews: El numero de opiniones
- overall_satisfaction: Puntuacion media del apartamento
- accommodates: El numero de personas que se pueden alojar en la propiedad
- bedrooms: El número de habitaciones
- price: El precio (en euros) por noche

### Caso 1.

Alicia va a ir a Lisboa durante una semana con su marido y sus 2 hijos. Están buscando un apartamento con habitaciones separadas para los padres y los hijos. No les importa donde alojarse o el precio, simplemente quieren tener una experiencia agradable. Esto significa que solo aceptan lugares con más de 10 críticas con una puntuación mayor de 4. Cuando seleccionemos habitaciones para Alicia, tenemos que asegurarnos de ordenar las habitaciones de mejor a peor puntuación. Para aquellas habitaciones que tienen la misma puntuación, debemos mostrar antes aquellas con más críticas. Debemos darle 3 alternativas.


In [1]:
import pandas as pd

# Cargar el archivo 
df_airbnb = pd.read_csv("./Datos/airbnb.csv")

alicia_opciones= df_airbnb[(df_airbnb['reviews'] > 10) & (df_airbnb['overall_satisfaction'] > 4)]
alicia_opciones = alicia_opciones.sort_values(by=['overall_satisfaction', 'reviews'], ascending=[False, False])

# Seleccionar tres mejores opciones 
mejores_opciones = alicia_opciones.head(3)

# Mostrar las tres alternativas
print("Tres mejores opciones para Alicia:")
print(mejores_opciones[['room_id', 'neighborhood', 'overall_satisfaction', 'reviews']])

Tres mejores opciones para Alicia:
     room_id   neighborhood  overall_satisfaction  reviews
120   176153   Misericórdia                   5.0      438
931  1085634   Misericórdia                   5.0      379
212   299321  Santo António                   5.0      337


### Caso 2.
Roberto es un casero que tiene una casa en Airbnb. De vez en cuando nos llama preguntando sobre cuales son las críticas de su alojamiento. Hoy está particularmente enfadado, ya que su hermana Clara ha puesto una casa en Airbnb y Roberto quiere asegurarse de que su casa tiene más críticas que las de Clara. Tenemos que crear un dataframe con las propiedades de ambos. Las id de las casas de Roberto y Clara son 97503 y 90387 respectivamente. Finalmente guardamos este dataframe como excel llamado "roberto.xls

In [4]:
pip install openpyxl

Collecting openpyxl
  Downloading openpyxl-3.1.2-py2.py3-none-any.whl.metadata (2.5 kB)
Collecting et-xmlfile (from openpyxl)
  Downloading et_xmlfile-1.1.0-py3-none-any.whl.metadata (1.8 kB)
Downloading openpyxl-3.1.2-py2.py3-none-any.whl (249 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m250.0/250.0 kB[0m [31m4.4 MB/s[0m eta [36m0:00:00[0m:00:01[0m
[?25hDownloading et_xmlfile-1.1.0-py3-none-any.whl (4.7 kB)
Installing collected packages: et-xmlfile, openpyxl
Successfully installed et-xmlfile-1.1.0 openpyxl-3.1.2
Note: you may need to restart the kernel to use updated packages.


In [5]:
import pandas as pd

df_airbnb = pd.read_csv("./Datos/airbnb.csv")

# Filtrar propiedades de Roberto y Clara
id_roberto = 97503
id_clara = 90387

prop_roberto = df_airbnb[df_airbnb['room_id'] == id_roberto]
prop_clara = df_airbnb[df_airbnb['room_id'] == id_clara]
roberto_clara_df = pd.concat([prop_roberto, prop_clara])

# Guardar el DataFrame como un archivo Excel
roberto_clara_df.to_excel("roberto.xlsx", index=False)

print("DataFrame con propiedades de Roberto y Clara 'roberto.xlsx'")


DataFrame con propiedades de Roberto y Clara 'roberto.xlsx'


### Caso 3.
Diana va a Lisboa a pasar 3 noches y quiere conocer a gente nueva. Tiene un presupuesto de 50€ para su alojamiento. Debemos buscarle las 10 propiedades más baratas, dandole preferencia a aquellas que sean habitaciones compartidas (room_type == Shared room), y para aquellas viviendas compartidas debemos elegir aquellas con mejor puntuación.

In [6]:
import pandas as pd

df_airbnb = pd.read_csv("./Datos/airbnb.csv")
presupuesto = 50
noches = 3

# Calcular el presupuesto total 
p_total = presupuesto * noches

# Filtrar alojamientos 
opciones_diana = df_airbnb[(df_airbnb['price'] <= p_total) & (df_airbnb['accommodates'] >= 3)]
opciones_diana = opciones_diana.sort_values(by=['room_type', 'price', 'overall_satisfaction'], ascending=[True, True, False])

# 10 propiedades más baratas
opciones_baratas = opciones_diana.head(10)

# Mostrar resultado
print("10 propiedades más baratas para Diana:")
print(opciones_baratas[['room_id', 'neighborhood', 'price', 'overall_satisfaction', 'room_type']])


10 propiedades más baratas para Diana:
       room_id       neighborhood  price  overall_satisfaction  \
7763  13342103  Santa Maria Maior   10.0                   4.5   
5793   9788273      Santo António   15.0                   3.0   
8665  14372309             Lumiar   18.0                   4.5   
6280  11011735            Arroios   21.0                   4.5   
2918   4182572  Santa Maria Maior   21.0                   3.5   
5930  10105498    Penha de França   22.0                   0.0   
9552  15565916          Alcântara   23.0                   5.0   
582     689000  Santa Maria Maior   23.0                   4.5   
8755  14495197        São Vicente   25.0                   4.5   
340     454217  Santa Maria Maior   25.0                   4.0   

            room_type  
7763  Entire home/apt  
5793  Entire home/apt  
8665  Entire home/apt  
6280  Entire home/apt  
2918  Entire home/apt  
5930  Entire home/apt  
9552  Entire home/apt  
582   Entire home/apt  
8755  Entire home/