# Seaborn

**`seaborn`** es una librería de visualización de datos para python desarrollada sobre **`matplotlib`**. Ofrece una interfaz de alto nivel para la creación de gráficas. Además, está integrada con las estructuras de datos de **`pandas`**, lo que permite utilizar el nombre de los **`DataFrames`** y campos directamente como argumentos de las funciones de visualización.


|Función               | Plot                                                                                                                                  |
|----------------------|---------------------------------------------------------------------------------------------------------------------------------------|
|**`sns.pairplot()`**  | Crea una matriz de graficas, en la diagonal aparece el **`histograma`** y en los demás una gráfica de **`dispersión`**.              |
|**`sns.barplot()`**   | Crea un gráfico de barras con el promedio de los valores.                                                                              |
|**`sns.countplot()`** | Crea un grafico de barras con el conteo de cada categoria.                                                                            |
|**`sns.histplot()`**  | Crea un histograma.                                                                                                                    |
|**`sns.jointplot()`** | Crea graficos de dispersión.                                                                                                          |
|**`sns.kdeplot()`**   | Crea graficos de densidad de probabilidad de la curva continua de los datos.                                                          |
|**`sns.boxplot()`**   | Crea graficos de caja.                                                                                                                |
|**`sns.violinplot()`**| Crea graficos de violin.                                                                                                              |
|**`sns.heatmap()`**   | Crea mapas de calor.                                                                                                                  |
|**`sns.FacetGrid()`** | Genera una matriz de graficas filtrando por las columnas y filas del **`DataFrame`** y aplicando una misma grafica a toda la matriz.|

In [None]:
import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
df1 = pd.read_excel("Airbnb_NYC.xlsx", sheet_name = "NYC1")
df2 = pd.read_excel("Airbnb_NYC.xlsx", sheet_name = "NYC2")

df = pd.merge(right = df1, left = df2, right_on = "id", left_on = "id")

df.head(3)

In [None]:
df.shape

In [None]:
df = df.sort_values("price").iloc[1000:20000][["host_id", "municipio", "number_of_reviews", "reviews_per_month", "price", "room_type"]]

df.head(3)

In [None]:
iris = sns.load_dataset("iris")
iris

### sns.pairplot()

In [None]:
sns.pairplot(iris)
plt.show()

In [None]:
# Con la parámetro "hue" podemos ver cada categoría por color 

sns.pairplot(iris, hue = "species")
plt.show()

In [None]:
sns.pairplot(df, hue = "room_type") 
plt.show()

In [None]:
# Con "vars" podemos elegir cuales columnas mostrar
# Con "height" podemos modificar el tamaño de las graficas

sns.pairplot(df, vars = ["price", "number_of_reviews"], height = 10, hue = "room_type")
plt.show()

### sns.barplot()

In [None]:
# Muestra el promedio del precio del tipo de habitación

sns.barplot(x = "room_type", y = "price", data = df)
plt.show()

In [None]:
# Otra forma de usar los parámetros

sns.barplot(x = df["room_type"], y = df["price"])
plt.show()

In [None]:
# Con "order" podemos elegir el orden en el que aparecen

sns.barplot(x = "room_type", y = "price", data = df, order = ["Entire home/apt", "Private room", "Shared room"]) 
plt.show()

In [None]:
plt.figure(figsize = (10, 6))

sns.barplot(x = "room_type", y = "price", hue = "municipio", data = df, palette = "rainbow")

plt.show()

In [None]:
fig, ax = plt.subplots(figsize = (10, 6))

sns.barplot(x = "municipio", y = "price", hue = "room_type", data = df, palette = "rainbow")
plt.show()

In [None]:
fig, ax = plt.subplots(figsize = (8, 6))

sns.barplot(x = "price", y = "room_type", hue = "municipio", data = df, palette = "rainbow")
plt.show()

In [None]:
fig, ax = plt.subplots(figsize = (8, 6))

sns.barplot(x = "price", y = "room_type", hue = "municipio", data = df, palette = "rainbow")

ax.legend_.remove()
plt.show()

### sns.countplot()

**`sns.countplot()`** es la función **`plt.bar()`** de **`matplotlib`**.

In [None]:
df["room_type"].value_counts()

In [None]:
plt.figure(figsize = (8, 6))

sns.countplot(x = df["room_type"])

plt.show() 

In [None]:
# El número dentro del color_palette se utiliza para elegir el número de colores
sns.countplot(x = df["room_type"], facecolor = (0.9, 0.9, 0.9), linewidth = 1, edgecolor = sns.color_palette("rainbow", 3))
plt.show()

In [None]:
plt.figure(figsize = (6, 4))
sns.countplot(x = "municipio", hue = "room_type", data = df, palette = "Blues_r")
plt.show()

### Histogramas

**`sns.histplot()`**

In [None]:
sns.histplot(df["price"])
plt.show()

In [None]:
sns.histplot(df["price"], color = "green", kde = True)
plt.show()

In [None]:
sns.histplot(df["number_of_reviews"], color = "green")
plt.show()

### Scatter Plots (graficos de dispersión) 
**`sns.jointplot()`**

In [None]:
sns.jointplot(x = df["reviews_per_month"], y = df["number_of_reviews"])
plt.show()

In [None]:
sns.jointplot(x = df[df["number_of_reviews"] < 50].reviews_per_month,
              y = df[df["number_of_reviews"] < 50].number_of_reviews,
              kind = "hex",
              gridsize = 20)

plt.show()

### sns.kdeplot()

**`Kernel Density Estimate (KDE)`** nos permite estimar la función de densidad de probabilidad de la curva continua (o no paramétrica) de nuestro conjunto de datos en una o más dimensiones.

En otras palabras, es un método para la visualización de las distribución de los **patrones** u **observaciones** del dataset, es análogo a un histograma.

In [None]:
df["reviews_per_month"].replace({np.nan : df["reviews_per_month"].mean()}, inplace = True)

sns.kdeplot(x = df[df["number_of_reviews"] < 10].reviews_per_month,
            y = df[df["number_of_reviews"] < 10].number_of_reviews)
plt.show()

In [None]:
sns.kdeplot(x = df[df["number_of_reviews"] < 10].reviews_per_month,
            y = df[df["number_of_reviews"] < 10].number_of_reviews,
           shade = True, 
           n_levels = 6)
plt.show()

In [None]:
sns.kdeplot(x = df[df["number_of_reviews"] < 10].reviews_per_month,
            y = df[df["number_of_reviews"] < 10].number_of_reviews,
           shade = True, 
           n_levels = 3)
plt.show()

### sns.boxplot() y sns.violinplot()

In [None]:
sns.boxplot(x = df["room_type"],
            y = df[df["number_of_reviews"] < 100].number_of_reviews)

plt.show()

In [None]:
sns.violinplot(x = df.room_type,
               y = df[df["number_of_reviews"] < 100].number_of_reviews)

plt.show()

In [None]:
sns.boxplot(x = "municipio", y = "price", data = df)
plt.show()

In [None]:
plt.subplots(figsize = (12, 8))

sns.boxplot(x = "municipio",
            y = "price",
            hue = "room_type",
            data = df[df["price"] < 210],
            palette = "Blues")
plt.show()

In [None]:
plt.subplots(figsize = (12, 8))

sns.boxplot(x = "room_type",
            y = "reviews_per_month",
            hue = "municipio",
            data = df)

plt.show()

### sns.heatmap()

Mapas de calor.

In [None]:
df[["number_of_reviews", "reviews_per_month", "price"]].corr()

In [None]:
sns.heatmap(data = df[["number_of_reviews", "reviews_per_month", "price"]].corr())
plt.show()

In [None]:
sns.heatmap(data = df[["number_of_reviews", "reviews_per_month", "price"]].corr(),
            annot = True,
            cmap = "Blues")
plt.show()

In [None]:
sns.heatmap(data = df.corr(),
            annot = True,
            cmap = "Blues")
plt.show()

### FacetGrid()

**`sns.FacetGrid()`** genera una matriz de graficas filtrando por las columnas y filas del DataFrame y aplicando una misma grafica a toda la matriz.

In [None]:
g = sns.FacetGrid(df, col = "municipio", row = "room_type")
g.map(plt.hist, "price")
plt.show()

In [None]:
g = sns.FacetGrid(df, col = "municipio", row = "room_type")
g.map(sns.violinplot, "price")
plt.show()

In [None]:
g = sns.FacetGrid(df, col = "municipio", row = "room_type")
g.map(sns.histplot, "price")
plt.show()

### Otros Plots

In [None]:
labels = np.array(iris.columns[:-1])

pattern = iris.iloc[0, :-1]

angles = np.linspace(0, 2*np.pi, len(labels), endpoint = False)
print(angles)

# Esto es para añadir el último lado del polígono:
pattern = np.concatenate((pattern, [pattern[0]]))
angles = np.concatenate((angles, [angles[0]]))


fig = plt.figure()
ax = fig.add_subplot(polar = True)

ax.plot(angles, pattern, "o-", linewidth = 4)           # Lineas en azul
ax.fill(angles, pattern, alpha = 1, color = "yellow")   # Relleno amarillo
ax.set_thetagrids(angles[:-1] * 180/np.pi, labels)      # Malla

plt.show()

In [None]:
################################################################################################################################