# Pandas - Explorando información de AirBnB

In [None]:
import numpy as np
import pandas as pd

Para evaluar los conocimientos adquiridos sobre la librería de análisis de datos Pandas, vamos a realizar un pequeño ejercicio de análisis exploratorio sobre un set de datos con información sobre AirBnB.

Más concretamente, junto con la práctica se entrega un fichero airbnb.csv que contiene información sobre alojamientos disponibles en AirBnB. Estos datos incluyen, entre otras cosas, información sobre ubicación, precios, reviews, ocupación, etc.
Con este set de datos, deberás preparar un Notebook donde se resuelvan las siguientes cuestiones. 

1. Carga del set de datos en una variable llamada “airbnb”

In [None]:
airbnb = pd.read_csv('data/airbnb.csv')
airbnb.head()

2. Número de observaciones incluidas en el set de datos.

In [None]:
airbnb.shape[0]

3. Listado de variables (y sus tipos) incluidas en el set de datos.

In [None]:
airbnb.dtypes

4. Estadísticos básicos sólo de las variables numéricas del set de datos. 

In [None]:
airbnb.describe()

5. Tablas de frecuencia sólo de las variables categóricas del set de dato.

In [None]:
airbnb.location.value_counts()

In [None]:
airbnb.area.value_counts()

In [None]:
airbnb.room_type.value_counts()

6. Identificación de variables con missing values y proporción de los mismos.

In [None]:
airbnb.isna().sum()

# Pandas - Analizando información de AirBnB

Tras la exploración básica del set de datos del ejercicio anterior, debería ser sencillo obtener insights o conclusiones sobre los costes de los seguros informados.
El objetivo de este ejercicio, será utilizar las diferentes funcionalidades de agrupación y agregación que pone a nuestra disposición el módulo pandas de Python para
responder a un pequeño conjunto de preguntas sobre las ofertas disponibles.

**IMPORTANTE:** los ejercicios se deberán utilizar las funcionalidades de agrupación y agregación de Pandas y NO tablas pivote.
    
El listado de preguntas que se deberá responder es el siguiente:

1. ¿Hay más ofertas de “Private room” o de “Entire home” en el dataset? ¿Cuántos más en porcentaje?

In [None]:
airbnb.shape[0]

In [None]:
private_room_count = airbnb[airbnb.room_type == "Private room"].shape[0]
private_room_count

In [None]:
entire_home_count = airbnb[airbnb.room_type == "Entire home/apt"].shape[0]
entire_home_count

In [None]:
private_room_count/entire_home_count

2. ¿Dónde está localizado el alojamiento más barato? Incluye en la respuesta localización, área y coordenadas.

In [None]:
airbnb[airbnb.price == min(airbnb.price)][['location', 'area', 'latitude', 'longitude']]

3. ¿Cuál es el precio medio de las ofertas de cada área?


In [None]:
grouped_by_area = airbnb.groupby(by='area')
grouped_by_area.price.mean()

4. ¿Qué correlación hay entre el precio y el número de reviews?

In [None]:
airbnb.corr()

In [None]:
airbnb.corr().loc['price', 'number_of_reviews']

5. ¿Cuál es el número total de ofertas por tipo y ubicación (location)?

In [None]:
grouped_by_room = airbnb.groupby(by='room_type')
grouped_by_room.count()

In [None]:
grouped_by_location = airbnb.groupby(by='location')
grouped_by_location.count()

6. ¿Cuáles son los 15 hosts con mayor número de ofertas disponibles? Incluye en el resultado únicamente el nombre del host y el número de ofertas disponibles.

In [None]:
grouped_by_host = airbnb.groupby(by='host_id')

In [None]:
sorted_by_count = grouped_by_host.count().sort_values(by='id', ascending=False)