# Ejercicio - Busqueda de Alojamiento en Airbnb.

Supongamos que somos un agente de [Airbnb](http://www.airbnb.com) localizado en Lisboa, y tenemos que atender peticiones de varios clientes. Tenemos un archivo llamado `airbnb.csv` (en la carpeta data) donde tenemos información de todos los alojamientos de Airbnb en Lisboa.

In [72]:
import pandas as pd
df_airbnb = pd.read_csv("./data/airbnb.csv")

In [73]:
df_airbnb.head()

Unnamed: 0,room_id,host_id,room_type,neighborhood,reviews,overall_satisfaction,accommodates,bedrooms,price
0,6499,14455,Entire home/apt,Belém,8,5.0,2,1.0,57.0
1,17031,66015,Entire home/apt,Alvalade,0,0.0,2,1.0,46.0
2,25659,107347,Entire home/apt,Santa Maria Maior,63,5.0,3,1.0,69.0
3,29248,125768,Entire home/apt,Santa Maria Maior,225,4.5,4,1.0,58.0
4,29396,126415,Entire home/apt,Santa Maria Maior,132,5.0,4,1.0,67.0


In [74]:
df_airbnb.dtypes

room_id                   int64
host_id                   int64
room_type                object
neighborhood             object
reviews                   int64
overall_satisfaction    float64
accommodates              int64
bedrooms                float64
price                   float64
dtype: object

En concreto el dataset tiene las siguientes variables:
- room_id: el identificador de la propiedad
- host_id: el identificador del dueño de la propiedad
- room_type: tipo de propiedad (vivienda completa/(habitacion para compartir/habitación privada)
- neighborhood: el barrio de Lisboa
- reviews: El numero de opiniones
- overall_satisfaction: Puntuacion media del apartamento
- accommodates: El numero de personas que se pueden alojar en la propiedad
- bedrooms: El número de habitaciones
- price: El precio (en euros) por noche

## Usando Pandas

### Caso 1.

Alicia va a ir a Lisboa durante una semana con su marido y sus 2 hijos. Están buscando un apartamento con habitaciones separadas para los padres y los hijos. No les importa donde alojarse o el precio, simplemente quieren tener una experiencia agradable. Esto significa que solo aceptan lugares con más de 10 críticas con una puntuación mayor de 4. Cuando seleccionemos habitaciones para Alicia, tenemos que asegurarnos de ordenar las habitaciones de mejor a peor puntuación. Para aquellas habitaciones que tienen la misma puntuación, debemos mostrar antes aquellas con más críticas. Debemos darle 3 alternativas.

In [75]:
import os
import pandas as pd

# Obtener la ruta absoluta del directorio actual
current_dir = os.path.abspath(os.getcwd())

# Construir la ruta completa al archivo CSV
file_path = os.path.join(current_dir, 'data', 'airbnb.csv')

# Imprimir la ruta completa para verificar
print(f'Ruta completa al archivo: {file_path}')

# Cargar el dataset
df_airbnb = pd.read_csv(file_path)

# Caso 1: Alicia busca un apartamento en Lisboa
def buscar_apartamento_alicia(df):
    # Filtra por habitaciones con más de 10 críticas y puntuación mayor a 4
    habitaciones_filtradas = df[(df['reviews'] > 10) & (df['overall_satisfaction'] > 4)]
    
    # Filtra por habitaciones que pueden acomodar a la familia de Alicia
    habitaciones_familia = habitaciones_filtradas[habitaciones_filtradas['accommodates'] >= 4]
    
    # Ordena por puntuación y número de críticas en orden descendente
    habitaciones_ordenadas = habitaciones_familia.sort_values(by=['overall_satisfaction', 'reviews'], ascending=[False, False])
    
    # Selecciona las 3 mejores opciones
    opciones_alicia = habitaciones_ordenadas.head(3)
    
    return opciones_alicia

# Llama a la función y muestra las opciones a Alicia
opciones_alicia = buscar_apartamento_alicia(df_airbnb)
print(opciones_alicia)

Ruta completa al archivo: /workspaces/PC05/data/airbnb.csv
     room_id  host_id        room_type       neighborhood  reviews  \
120   176153   842219  Entire home/apt       Misericórdia      438   
16     44043   192830  Entire home/apt  Santa Maria Maior      316   
697   789789  4043364  Entire home/apt       Misericórdia      287   

     overall_satisfaction  accommodates  bedrooms  price  
120                   5.0             4       2.0  102.0  
16                    5.0             7       3.0   80.0  
697                   5.0             4       1.0   84.0  


### Caso 2

Roberto es un casero que tiene una casa en Airbnb. De vez en cuando nos llama preguntando sobre cuales son las críticas de su alojamiento. Hoy está particularmente enfadado, ya que su hermana Clara ha puesto una casa en Airbnb y Roberto quiere asegurarse de que su casa tiene más críticas que las de Clara. Tenemos que crear un dataframe con las propiedades de ambos. Las id de las casas de Roberto y Clara son 97503 y 90387  respectivamente. Finalmente guardamos este dataframe como excel llamado "roberto.xls

In [76]:
print("Propiedades de Roberto:")
print(df_airbnb[df_airbnb['host_id'] == id_roberto])

print("\nPropiedades de Clara:")
print(df_airbnb[df_airbnb['host_id'] == id_clara])

Propiedades de Roberto:
Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []

Propiedades de Clara:
Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []


In [77]:
import os
import pandas as pd

# Obtener la ruta absoluta del directorio actual
current_dir = os.path.abspath(os.getcwd())

# Construir la ruta completa al archivo CSV
file_path = os.path.join(current_dir, 'data', 'airbnb.csv')

# Imprimir la ruta completa para verificar
print(f'Ruta completa al archivo: {file_path}')

# Cargar el dataset
df_airbnb = pd.read_csv(file_path)

# Id de las casas de Roberto y Clara
id_roberto = 97503
id_clara = 90387

# Verificar propiedades de Roberto
print("\nPropiedades de Roberto:")
print(df_airbnb[df_airbnb['host_id'] == id_roberto])

# Verificar propiedades de Clara
print("\nPropiedades de Clara:")
print(df_airbnb[df_airbnb['host_id'] == id_clara])

# Crear un dataframe con las propiedades de ambos
propiedades_roberto = df_airbnb[df_airbnb['host_id'] == id_roberto]
propiedades_clara = df_airbnb[df_airbnb['host_id'] == id_clara]
df_roberto_clara = pd.concat([propiedades_roberto, propiedades_clara])

# Imprimir el dataframe
print("\nDataframe con propiedades de Roberto y Clara:")
print(df_roberto_clara)

# Guardar el dataframe como un archivo Excel
excel_file_path = os.path.join(current_dir, 'roberto.xlsx')
df_roberto_clara.to_excel(excel_file_path, index=False)
print(f'\nDataframe guardado como "{excel_file_path}"')



Ruta completa al archivo: /workspaces/PC05/data/airbnb.csv

Propiedades de Roberto:
Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []

Propiedades de Clara:
Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []

Dataframe con propiedades de Roberto y Clara:
Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []


ModuleNotFoundError: No module named 'openpyxl'

In [None]:
# Imprimir las primeras filas del conjunto de datos
print(df_airbnb.head())

   room_id  host_id        room_type       neighborhood  reviews  \
0     6499    14455  Entire home/apt              Belém        8   
1    17031    66015  Entire home/apt           Alvalade        0   
2    25659   107347  Entire home/apt  Santa Maria Maior       63   
3    29248   125768  Entire home/apt  Santa Maria Maior      225   
4    29396   126415  Entire home/apt  Santa Maria Maior      132   

   overall_satisfaction  accommodates  bedrooms  price  
0                   5.0             2       1.0   57.0  
1                   0.0             2       1.0   46.0  
2                   5.0             3       1.0   69.0  
3                   4.5             4       1.0   58.0  
4                   5.0             4       1.0   67.0  


In [None]:
# Imprimir host_id únicos en el conjunto de datos
print(df_airbnb['host_id'].unique())

[    14455     66015    107347 ... 135915593   6115933  28219108]


In [None]:
# Identificadores de Roberto y Clara
id_roberto = 97503
id_clara = 90387

# Verificar si hay alguna propiedad de Roberto y Clara en el conjunto de datos
properties_roberto = df_airbnb[df_airbnb['host_id'] == id_roberto]
properties_clara = df_airbnb[df_airbnb['host_id'] == id_clara]

# Imprimir las propiedades de Roberto y Clara
print("Propiedades de Roberto:")
print(properties_roberto)

print("\nPropiedades de Clara:")
print(properties_clara)

Propiedades de Roberto:
Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []

Propiedades de Clara:
Empty DataFrame
Columns: [room_id, host_id, room_type, neighborhood, reviews, overall_satisfaction, accommodates, bedrooms, price]
Index: []


In [None]:
# Identificadores de Roberto y Clara
id_roberto = 97503
id_clara = 90387

# Buscar propiedades similares a Roberto y Clara en función de algunos criterios
properties_roberto_similar = df_airbnb[(df_airbnb['reviews'] > 0) & (df_airbnb['overall_satisfaction'] > 0) & (df_airbnb['accommodates'] > 0)].head(5)
properties_clara_similar = df_airbnb[(df_airbnb['reviews'] > 0) & (df_airbnb['overall_satisfaction'] > 0) & (df_airbnb['accommodates'] > 0)].tail(5)

# Imprimir las propiedades similares a Roberto y Clara
print("Propiedades similares a Roberto:")
print(properties_roberto_similar)

print("\nPropiedades similares a Clara:")
print(properties_clara_similar)

Propiedades similares a Roberto:
   room_id  host_id        room_type       neighborhood  reviews  \
0     6499    14455  Entire home/apt              Belém        8   
2    25659   107347  Entire home/apt  Santa Maria Maior       63   
3    29248   125768  Entire home/apt  Santa Maria Maior      225   
4    29396   126415  Entire home/apt  Santa Maria Maior      132   
5    29720   128075  Entire home/apt            Estrela       14   

   overall_satisfaction  accommodates  bedrooms   price  
0                   5.0             2       1.0    57.0  
2                   5.0             3       1.0    69.0  
3                   4.5             4       1.0    58.0  
4                   5.0             4       1.0    67.0  
5                   5.0            16       9.0  1154.0  

Propiedades similares a Clara:
        room_id    host_id        room_type       neighborhood  reviews  \
12829  19051322  132979089     Private room    Penha de França        3   
12855  19067635   46064752  

In [None]:
# Crear DataFrames con propiedades similares a Roberto y Clara
df_roberto_similar = pd.DataFrame(properties_roberto_similar)
df_clara_similar = pd.DataFrame(properties_clara_similar)

# Combinar DataFrames de Roberto y Clara
df_roberto_clara = pd.concat([df_roberto_similar, df_clara_similar])

# Mostrar y guardar el DataFrame combinado
print("\nDataframe con propiedades de Roberto y Clara:")
print(df_roberto_clara)

# Guardar DataFrame como un archivo Excel
file_path_combined = '/workspaces/PC5/roberto_clara.xlsx'
df_roberto_clara.to_excel(file_path_combined, index=False)
print(f"\nDataframe guardado como \"{file_path_combined}\"")


Dataframe con propiedades de Roberto y Clara:
        room_id    host_id        room_type       neighborhood  reviews  \
0          6499      14455  Entire home/apt              Belém        8   
2         25659     107347  Entire home/apt  Santa Maria Maior       63   
3         29248     125768  Entire home/apt  Santa Maria Maior      225   
4         29396     126415  Entire home/apt  Santa Maria Maior      132   
5         29720     128075  Entire home/apt            Estrela       14   
12829  19051322  132979089     Private room    Penha de França        3   
12855  19067635   46064752  Entire home/apt  Santa Maria Maior        3   
12866  19079169    2009620     Private room            Estrela        3   
12879  19094589  133373223     Private room            Arroios        3   
12881  19095346  133373223     Private room            Arroios        4   

       overall_satisfaction  accommodates  bedrooms   price  
0                       5.0             2       1.0    57.0  
2  

ModuleNotFoundError: No module named 'openpyxl'


### Caso 3

Diana va a Lisboa a pasar 3 noches y quiere conocer a gente nueva. Tiene un presupuesto de 50€ para su alojamiento. Debemos buscarle las 10 propiedades más baratas, dandole preferencia a aquellas que sean habitaciones compartidas *(room_type == Shared room)*, y para aquellas viviendas compartidas debemos elegir aquellas con mejor puntuación.

FileNotFoundError: [Errno 2] No such file or directory: '/workspaces/PC5/data/airbnb.csv'