# Matplotlib & Seaborn

![](matplotlib.png)

Matplotlib es una biblioteca de Python para crear visualizaciones estáticas, animadas e interactivas. Existen innumerables recursos para aprender a usarlo en la web. No obstante, un buen lugar para comenzar es https://matplotlib.org/stable/index.html

## Pyplot

In [None]:
import matplotlib.pyplot as plt
import numpy as np

In [None]:
x = np.linspace(0,5,11) # Ejecuta una serie de números de manera aleatoria 
y = x**2
print(x)
print(y)

### Ahora realizaremos pequeñas visualizaciones

In [None]:
plt.plot(x,y)
plt.show() # para que se muestre la gráfica

In [None]:
plt.plot(x,y,'rx') # rx significa que quiero la línea de color rojo y con marcadores x
plt.show()

In [None]:
plt.plot(x,y,'bo') # bo significa que quiero la línea de color azul y con marcadores con forma de círculo
plt.show()

In [None]:
plt.plot(x,y,'rs-') # - indica que quiero una continuidad entre cada marcador
plt.show()

In [None]:
plt.plot(x,y,'yD:')
plt.show()

In [None]:
plt.hist(x)
plt.show()

In [None]:
plt.pie(x)
plt.show()

In [None]:
plt.scatter(x,y)
plt.show()

In [None]:
plt.boxplot(x)
plt.show()

## Subplot

#### Subplot es la herramienta que nos permite tener varios gráficos en la notebook, según se requiera.

In [None]:
# Supongamos que quiero dos gráficos, uno que me muestre la relación entre x e y, y la otra que sea un histograma

plt.subplot(1,2,1) # el primer parámetro es la cantidad de filas, el segundo es la cantidad de columnas, y el tercero es el index que voy a manejar entre las filas y columnas definidas previamente)
plt.plot(x,y,'r--')
plt.subplot(1,2,2)
plt.hist(y)
plt.show()

In [None]:
plt.subplot(1,2,1) 
plt.plot(x,y,'r--')
# Agrego una nueva linea de color azul en el primer gráfico
plt.plot(y,x,'b:')
plt.subplot(1,2,2)
# Cambio el histograma por un gráfico de torta
plt.pie(y)
plt.show()

In [None]:
#Realizo unos cambios para trabajar con dos filas y una columna
plt.subplot(2,1,1) 
plt.plot(x,y,'r--')
plt.plot(y,x,'b:')
plt.subplot(2,1,2)
plt.pie(y)
plt.show()

## Método Orientado a Objetos

###### Existen dos maneras de ejecutar gráficas o visualizaciones dentro de matplotlib:
 - **Pyplot**: es sencillo, fácil, rápido y no demanda mucho código. Sin embargo es difícil customizar el gráfico o señalar ciertos detalles.
  - **Object Oriented**: es un poco más difícil de usar, necesita un poco más de código; pero la personalización que se puede lograr es mucho más amigable. También permite integrar distintos tipos de gráfico en uno solo.

#### 1. Primero creo una figura, la cual representara el lienzo en donde alojaremos nuestro gráfico o gráficos.
#### 2. Los gráficos que voy a ilustrar en el lienzo se denominan axes.
```python
axes = fig.add_axes([0.1,0.1,0.5,0.9]) 
# Los dos primeros parámetros hacen establecen la posición de la figura en el lienzo. 
# Los últimos dos parámetros hacen referencia al tamaño de la figura
```

#### La ventaja del Método Orientado a Objetos es que te permitirá customizar mejor tus visualizaciones y aplicar mayor detalle a los gráficos.

In [None]:
fig = plt.figure()
axes = fig.add_axes([0.1,0.1,0.8,0.9])
axes2 = fig.add_axes([0.2,0.55,0.4,0.3]) # Le indico que quiero un segundo gráfico. 
axes.plot(x, y, 'b') 
axes2.plot(y,x,'r')
axes2.set_facecolor('#e6e6fa')

#### Detalles sobre colores disponibles https://matplotlib.org/stable/tutorials/colors/colors.html

#### Cómo se menciono previamente, la mayor ventaja de utilizar el Método Orientado a Objetos es que permite personalizar la visualización.

![alt text](curso_matplotlib2.GIF)

#### Un objeto define una **figura**. Esa figura es un **lienzo** en el cual voy a meter **gráficas**. A cada una de esas gráficas voy a llamar **axes**. Estos axes, a su vez, pueden tener distintos ejes, denominados **axis**.
![alt text](curso_matplotlib3.GIF)

## Subplots

#### La diferencia entre Subplot y Subplots, es que esta última permite trabajar múltiples gráficas en un solo lienzo y aprovecha las bondades de trabajar con el Método Orientado a Objetos de Matplotlib. 

In [None]:
# Defino un array utilizando numpy
x = np.linspace(0,5,11)
# Aplico una función seno a x
y = np.sin(x)

In [None]:
# Voy a crear un lienzo con un gráfico adentro
fig, axes = plt.subplots()
axes.plot(x,y,'b')

In [None]:
# Realizaremos algunos pequeños cambios al gráfico
fig, axes = plt.subplots(nrows = 1, ncols = 2)

In [None]:
fig, axes = plt.subplots(nrows = 1, ncols = 2)
# Ahora realizo cambios en cada uno de los gráficos
# De esta manera puedo definir objetos independientes y acceder a ellos mediante un índice
axes[0].plot(x,y,'b')
axes[1].plot(y,x,'r')

In [None]:
# Otra manera de hacerlo
fig, (ax1, ax2) = plt.subplots(nrows = 1, ncols = 2)
ax1.plot(x,y,'b')
ax2.plot(y,x,'r')

In [None]:
# Seguimos explorando el nivel de detalle
fig, axes = plt.subplots(nrows = 2, ncols = 4)

In [None]:
fig, axes = plt.subplots(nrows = 2, ncols = 4)
axes[0,0].plot(x,np.cos(x)) # De esta manera indicamos que queremos el plot para el primer axe
# del mismo modo podemos agregar plot en el resto de los axes
axes[0,1].plot(x,np.sin(x),'y')
axes[0,2].plot(x,np.tan(x),'r')
axes[0,3].plot(x,np.cos(x)**2)

In [None]:
# Otra manera de hacerlo
fig, ((ax1,ax2,ax3,ax4),(ax5,ax6,ax7,ax8)) = plt.subplots(nrows = 2, ncols = 4)
ax1.plot(x,np.cos(x)) 
ax2.plot(x,np.sin(x),'y')
ax3.plot(x,np.tan(x),'r')
ax4.plot(x,np.cos(x)**2)

In [None]:
# Aplico tight_layout para que la visualización se vea mejor
fig, ((ax1,ax2,ax3,ax4),(ax5,ax6,ax7,ax8)) = plt.subplots(nrows = 2, ncols = 4)
ax1.plot(x,np.cos(x)) 
ax2.plot(x,np.sin(x),'y')
ax3.plot(x,np.tan(x),'r')
ax4.plot(x,np.cos(x)**2)
fig.tight_layout()

In [None]:
# Ahora voy a graficar los plots en los axes de abajo
fig, ((ax1,ax2,ax3,ax4),(ax5,ax6,ax7,ax8)) = plt.subplots(nrows = 2, ncols = 4)
ax1.plot(x,np.cos(x)) 
ax2.plot(x,np.sin(x),'y')
ax3.plot(x,np.tan(x),'r')
ax4.plot(x,np.cos(x)**2)
ax5.plot(x,np.cos(x),'bs') 
ax6.plot(x,np.tan(x-1/x),'g--')
ax7.plot(x,np.tan(x),'r:')
ax8.plot(x,np.sin(y*x)**2,'purple')
fig.tight_layout()

## Leyendas, etiquetas, títulos, tamaño

In [None]:
x = np.linspace(0,5,11)
y = np.sin(x)

In [None]:
fig, axes = plt.subplots(1,2)

axes[0].plot(x,y,label = '$sin(x)$') # Agrego un label
# Agrego un título
axes[0].set_title('Relación X - Y')
# Agrego labels en los ejes X e Y
axes[0].set_xlabel('X')
axes[0].set_ylabel('Y')
axes[0].legend() # para agregar el label

axes[1].plot(y,x)
# Agrego un título
axes[1].set_title('Relación Y - X')
# Agrego labels en los ejes X e Y
axes[1].set_xlabel('Y')
axes[1].set_ylabel('X')

fig.tight_layout() # Siempre al aplicar tight_layout() el grafico se vera mucho mejor

In [None]:
plt.plot(x,y,label='$sin(x)$')
plt.title('Este es un título')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc='upper right')

## Colores y Estilos

#### + Primero revisare todos los estilos predefinidos disponibles para trabajar. 
#### + Esto me permitirá personalizar el estilo de mis gráficos según mi preferencia.

In [None]:
from matplotlib import style 
print(plt.style.available)

#### Defino con que estilo deseo trabajar

In [None]:
plt.style.use('ggplot')
# Con esta simple linea de codigo puedo cambiar el estilo de mis gráficas al que yo prefiera.

#### Tambien puedo hacer modificaciones y agregar detalles a mi grafico siguiendo lineamientos de Matlab

In [None]:
fig, ax = plt.subplots(figsize=(8,8))
ax.plot(x,x+1,'r')
ax.plot(x,x+2,'b')
ax.plot(x,x+3,'y')
ax.plot(x,x+4,'g')

#### Puedo customizar las lineas

In [None]:
fig, ax = plt.subplots(figsize=(8,8))
ax.plot(x,x+1,'r--')
ax.plot(x,x+2,'b-')
ax.plot(x,x+3,'y.-')
ax.plot(x,x+4,'go:')

#### Ahora hago lo mismo utilizando Pyplot
#### Con alpha regulo la transparencia, con linewidth el ancho de la linea.
#### Tambien puedo configurar el tipo de marker, su tamaño ('markersize') y su color ('markerfacecolor')
Recursos y detalles sobre colores -> https://matplotlib.org/3.5.1/tutorials/colors/colors.html

In [None]:
fig, ax = plt.subplots(figsize=(8,8))
ax.plot(x,x+1, color = 'green', alpha = 0.8, linewidth = 5, linestyle = '-',marker='o', markersize = 10, markerfacecolor = '#CCFFCC') 
ax.plot(x,x+2, color = 'blue', linewidth = 8, linestyle = '--',marker='x')
ax.plot(x,x+3, color = '#66FF66', linewidth = 3, linestyle = 'dashed',marker='v')
ax.plot(x,x+4, color = '#CCFFCC', linewidth = 2, linestyle = ':',marker='p')

## Bar plot

#### Las graficas de barras nos permite graficar variables categóricas, y Matplotlib ofrece ciertas características que nos facilitan la vida al momento de graficarlas. 

In [None]:
country = ['INDIA', 'JAPAN', 'MEXICO', 'COLOMBIA', 'GERMANY']
population = [1000,800,900,1000,300]

#### Ahora utilizaremos la variable country, que es una variable categórica, para realizar el Bar Plot

In [None]:
plt.bar(country,population, width = 0.5, color = ['purple', 'red', 'green', 'blue', 'yellow'], edgecolor = 'grey')
# Para cambiar el idioma de las categorías del eje x y agrego que los nombres roten en 45grados.
plt.xticks(np.arange(5),('India', 'Japón', 'Mexico', 'Colombia', 'Alemania'), rotation = 45)
plt.xlabel("Países")
plt.ylabel("Población")
plt.title("Cantidad de habitantes por país")
plt.show()

#### Para hacer las barras horizontales debemos utilizar plt.barh

In [None]:
plt.barh(country,population, color = ['purple', 'red', 'green', 'blue', 'yellow'], edgecolor = 'grey')
plt.show()

## Crear otro tipo de gráficas (Histograma, Boxplot, Scatter)

#### Ahora practicaremos con otros tipos de gráficos disponibles en Matplotlib

In [None]:
# Para practicar me creo un dataset random con la función random de numpy.
data = np.random.randint(1,50,100)
data

#### Histograma

In [None]:
plt.hist(data)
plt.show()

In [None]:
plt.hist(data, bins = 50) # Modifico los bins
plt.show()

In [None]:
plt.hist(data, bins = 50, width = 10) # si deseo cambiar el ancho de las barras de frecuencia
plt.show()

In [None]:
plt.hist(data, bins = 10, histtype = 'step')
plt.show()

## Boxplot

#### Tambien conocido como grafico de cajas y bigotes

In [None]:
plt.style.use('classic') # Voy a cambiar el estilo para usar uno clásico
plt.boxplot(data)
plt.show

#### De esta manera obtengo mi boxplot que me entrega mi rango interquartílico, con el detalle a 25%, 50%, 75%

In [None]:
plt.boxplot(data, vert = False) # con esta propiedad lo hago horizontal
plt.show

In [None]:
plt.boxplot(data, vert = False)
plt.show

In [None]:
plt.boxplot(data, vert = False, notch = True)
plt.show

In [None]:
plt.style.use('Solarize_Light2')

In [None]:
data1 = np.append(data,200) # Agrego un outlier al dataset
plt.boxplot(data1, vert = False, patch_artist=True, notch = True, showfliers=True)
plt.show

In [None]:
plt.boxplot(data1, vert = False, notch = True, showfliers=False) # para que no muestre el outlier
plt.show

## Scatter

In [None]:
N = 50
x = np.random.rand(N)
y = np.random.rand(N)
area = (30 * np.random.rand(N)) **2
colors = np.random.rand(N)

In [None]:
plt.scatter(x,y)
plt.show()

In [None]:
plt.scatter(x,y, s = area) # el tamaño de cada punto refiere a la variable area
plt.show()

In [None]:
plt.scatter(x,y, s = area, c = colors) # agrego la variable colors al scatter
plt.show()

In [None]:
plt.scatter(x,y, s = area, c= colors, marker = 'o', alpha = 0.5) # agrego un alpha y defino el marker
plt.show()

## Seaborn

![alt text](seaborn.png)

**Seaborn** es una biblioteca de visualización de datos de Python basada en matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.

Fue creada por Michael Waskom, quien ofrece todo el detalle posible de la librería (tutoriales, ejemplos, etc) en: https://seaborn.pydata.org/ 

### Introducción a Seaborn

 ##### Algunas características:
 - Escrita por Michael Waskom
 - Construida sobre Matplotlib
 - Integrada para estructuras de Pandas

 ##### Por qué Seaborn? Que ventajas tiene?
 - Velocidad
 - Poco código
 - Customizable

![](estructura_basica.GIF)

![](tipos_graficas.GIF)

## Set

#### El parámetro Set es  muy importante por que de manera sencilla permite definir un tema o los colores que voy a utilizar o el tipo de fuente a usar.

In [None]:
import seaborn as sns

In [None]:
sns.barplot(x = ['A','B','C'], y = [1, 3, 2,])
plt.show()

In [None]:
sns.set(style='darkgrid') # cambiamos el estilo del grid
sns.barplot(x = ['A','B','C'], y = [1, 3, 2,])
plt.show()

In [None]:
sns.set(style='darkgrid', palette = 'dark') # cambiamos paleta de colores
sns.barplot(x = ['A','B','C'], y = [1, 2, 3,])
plt.show()

In [None]:
sns.set(style='darkgrid', palette = 'dark', font_scale = 1)
sns.barplot(x = ['A','B','C'], y = [1, 2, 3,])
plt.show()

#### Como podemos observar, la función Set es muy útil para cambiar de manera sencilla los estilos, la paleta de colores, la fuente, etc. https://seaborn.pydata.org/generated/seaborn.set_theme.html#seaborn.set_theme

## Parámetros más usados

#### Seaborn tiene un gran abanico de graficos y visualizaciones disponibles. No obstante, tiene ciertos parámetos que son muy comunes y son utilizados en cada gráfico.

In [None]:
tips = sns.load_dataset('tips') # descargaremos el dataset con propinas en un restaurante.
tips

In [None]:
sns.displot(data = tips, x = 'total_bill')
plt.show()

#### Así obtengo un histograma con la distribución del total de propinas en el eje x.

In [None]:
sns.displot(data = tips, x = 'total_bill', y = 'tip')
plt.show()

#### Como se puede observar, la función displot de seaborn identifica automáticamente que tipo de gráfico se ajusta mejor a los datos que quiero analizar.

In [None]:
# Agregando el parámetro hue puedo incluir una tercer variable, categorica, al análisis.
sns.displot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex')
plt.show()

In [None]:
# hue funciona con un histograma de la misma manera
sns.displot(data = tips, x = 'total_bill', hue = 'sex')
plt.show()

In [None]:
# con la función kind podes cambiar el tipo de gráfico
sns.displot(data = tips, x = 'total_bill', hue = 'sex', kind = 'kde')
plt.show()

In [None]:
# Puedo quitar la leyenda con el parámetro legend
sns.displot(data = tips, x = 'total_bill', hue = 'sex', kind = 'kde', legend = False)
plt.show()

In [None]:
# También puedo cambiar colores con palette
sns.displot(data = tips, x = 'total_bill', hue = 'sex', kind = 'kde', legend = True, palette = 'dark', alpha = .25)
plt.show()

Para mayor información, mejor visitar el sitio de la librería que además esta super útil:
https://seaborn.pydata.org
Otro sitio interesante para visitar también es: https://cheatography.com/aggialavura/cheat-sheets/python-seaborn-imgs/ 

## Distribuciones I

#### Variables numéricas

In [None]:
# Revisamos los primeros datos del dataset tips
tips.head()

In [None]:
sns.histplot(data=tips, x='tip', bins=15)
plt.show

In [None]:
# Si quiero ver el comportamiento acumulativo de mis frecuencias en el histograma
sns.histplot(data=tips, x='tip', bins=15, cumulative = True)
plt.show

In [None]:
sns.histplot(data=tips, x='tip', bins=15, cumulative = False, hue = 'sex', stat = 'percent')
plt.show

In [None]:
sns.histplot(data=tips, x='tip', bins=15, cumulative = False, hue = 'sex', stat = 'density')
plt.show

In [None]:
sns.histplot(data=tips, x='tip', bins=15, cumulative = False, hue = 'sex', stat = 'count', multiple = 'stack')
plt.show

In [None]:
sns.histplot(data=tips, x='tip', bins=15, cumulative = False, hue = 'sex', stat = 'count', multiple = 'dodge')
plt.show

In [None]:
sns.histplot(data=tips, x='tip', bins=15, cumulative = False, hue = 'sex', stat = 'count', multiple = 'fill')
plt.show

In [None]:
sns.kdeplot(data = tips,x='tip', hue = 'sex')
plt.show()

#### El gráfico nos informa que los hombres dejan propina más frecuentemente que las mujeres.

In [None]:
sns.kdeplot(data = tips,x='tip', hue = 'sex', cumulative = False, fill = True, bw_adjust=1)
plt.show()

In [None]:
sns.ecdfplot(data = tips, x = 'tip', hue = 'sex', stat='count')
plt.show()

In [None]:
sns.displot(data = tips, x = 'tip', hue = 'sex')
plt.show()

In [None]:
# Displot selecciona automáticamente un tipo de gráfico. No obstante, puedo especificar un grafico del tipo kde
sns.displot(data = tips, x = 'tip', hue = 'sex', kind = 'kde')
plt.show()

In [None]:
sns.displot(data = tips, x = 'tip', hue = 'sex', kind = 'hist', multiple = 'stack')
plt.show()

#### Al utilizar la función **displot** de seaborn podemos cambiar el tipo de gráfico con solo usar el parámetro kind. El que viene por default es hist, pero se lo puede cambiar facilemente usando kind = 'kde'

In [None]:
sns.scatterplot(data=tips,x='tip',y='total_bill',hue='smoker')
plt.show()

## Distribuciones II

#### Variables categóricas

In [None]:
tips.head()

In [None]:
sns.countplot(data = tips, x = 'day', hue = 'sex')
plt.show()

#### Podemos observar que los días Viernes es cuando menos propinas se registran en el restaurante. Otra observación posible es que los días Sábados, es cuando los clientes varones dejan la mayor cantidad de propinas.

In [None]:
plt.figure(figsize = (10,10)) # con esta línea de código configuro el tamaño de la figura.
sns.stripplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', dodge = True)
plt.show()
# Con el parámetro dodge puedo ver dividida la variable categorica sex en cada uno de los días.

In [None]:
# para revisar la concentración de los datos es mejor usar swarmplot
plt.figure(figsize = (10,10)) 
sns.swarmplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', dodge = True)
plt.show()

#### Algo que se puede observar del grafico es que, por ejemplo, los días Sábados, que es cuando los varones más propina dejan, la cuenta total se encuentra concentrada entre 19 y 20 dólares.

In [None]:
sns.swarmplot(data = tips, x = 'smoker', y = 'total_bill', hue = 'sex', dodge = True)
plt.show()

In [None]:
plt.figure(figsize = (10,10)) 
sns.boxplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', dodge = True)
plt.show()

In [None]:
sns.boxplot(data = tips, y = 'total_bill')
plt.show()

#### También podemos combinar dos gráficos

In [None]:
plt.style.use('classic')
plt.figure(figsize = (10,10)) 
sns.boxplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', dodge = True)
sns.swarmplot(data = tips, x = 'smoker', y = 'total_bill', hue = 'sex', dodge = True)
plt.show()

In [None]:
plt.style.use('classic')
sns.set_palette("pastel")
plt.figure(figsize = (10,10)) 
sns.violinplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', dodge = True)
plt.show()

In [None]:
plt.style.use('classic')
plt.figure(figsize = (10,10)) 
sns.violinplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', split = True, palette='muted')
plt.show()

In [None]:
sns.catplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', palette = 'bright', kind = 'swarm')
plt.show()

In [None]:
sns.catplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', palette = 'bright', kind = 'swarm', col='time')
plt.show()

#### **Con el parámetro col puedo agregar información de una variables categórica adicional, partiendo al gráfico en dos.**

In [None]:
sns.catplot(data = tips, x = 'day', y = 'total_bill', hue = 'sex', palette = 'bright', kind = 'box', col='time')
plt.show()

#### Entonces, en el último grafico estamos trabajando con cuatro variables en total. Por un lado tenemos a las variables categoricas: time, day, sex; y todas estas en relación al total bill.

#### Al utilizar la función **catplot** de seaborn podemos cambiar el tipo de gráfico con solo usar el parámetro kind.

In [None]:
sns.catplot(data=tips, x="day", hue="size", col="time", kind= "count", palette = 'pastel' )
plt.show()

## Relation

### - Scatterplot

In [None]:
plt.figure(figsize=(10,10))
markers = {"Lunch":"D", "Dinner":"s"}
sns.scatterplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', style ='time', palette = 'bright', size = 'size', markers = markers)
# Vamos a mover la leyenda para que no estorbe al gráfico
plt.legend(loc = 'center', bbox_to_anchor = (1.12, 0.6))
plt.show()

#### Pareciera haber una relación positiva entre el tamaño de la cuenta y la propina, lo cual tiene lógica.

#### **pairplot**, te permite ver comparativas de pares de variables y analizar su comportamiento en un solo gráfico.

###  - Lineplot

In [None]:
sns.lineplot(data = tips, x = 'total_bill', y = 'tip')
plt.show

In [None]:
sns.lineplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', style ='time', palette = 'bright', size = 'size', markers = markers)
plt.legend(loc = 'center', bbox_to_anchor = (1.12, 0.6))
plt.show()

##### - Relplot

In [None]:
sns.relplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', style ='time', palette = 'bright', size = 'size', markers = markers)
plt.show()

In [None]:
sns.relplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', style = 'time', palette = 'bright', size = 'size', markers = markers, kind = 'line')
plt.show()

#### Con el parámetro col podemos dividir el gráfico en función a una variable categórica

In [None]:
sns.relplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', style ='time', palette = 'bright', size = 'size', markers = markers, col = 'time')
plt.show()

##### - Pairplot

In [None]:
sns.pairplot(data=tips,hue='day')
plt.show() 

In [None]:
sns.pairplot(data = tips, hue = 'sex', palette = 'bright')
plt.show()

#### Joinplot/Pairplot

- Jointplot

Estas funciones permiten con un solo comando realizar distintos gráficos simultáneamente.

In [None]:
sns.jointplot(data = tips, x = 'total_bill', y = 'tip')
plt.show()

Cómo podemos observar, la función jointplot permite agrupar en un mismo gráfico dos visualizaciones distintas de los datos.
Con el diagram de dispersión revisamos la relación entre las propinas y el tamaño de la cuenta, mientras que con los histogramas vemos la distribución de frecuencias de cada variable.

Inclusive lo podemos customizar un poco más, por ejemplo utilizando el parámetro hue

In [None]:
sns.jointplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex')
plt.show()

In [None]:
plt.style.use('ggplot')
sns.jointplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', kind = 'hist')
plt.show()

In [None]:
sns.jointplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', kind = 'kde')
plt.show()

In [None]:
# Agrego el comando marginal_ticks y marginal_kws
sns.jointplot(data = tips, x = 'total_bill', y = 'tip', hue = 'sex', kind = 'hist', marginal_ticks=True, marginal_kws = dict(bins=25,fill=False, multiple='dodge'))
plt.show()

- Pairplot

Integra en un gráfico todas las variables numéricas

In [None]:
sns.pairplot(data = tips)
plt.show()

In [None]:
# puedo agregar el comando hue
sns.pairplot(data = tips, hue = 'sex')
plt.show()

In [None]:
# puedo agregar el comando palette
sns.pairplot(data = tips, hue = 'sex', palette = 'bright')
plt.show()

In [None]:
# puedo agregar el comando corner para no tener información duplicada
sns.pairplot(data = tips, hue = 'sex', palette = 'bright', corner = True)
plt.show()

### - Heatmap

Primero debemos revisar la correlación entre variables del dataset. Podemos hacer esto mediante la función corr de pandas.

Mas información sobre la función en -> https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.corr.html

In [None]:
tips.corr(numeric_only=True)

In [None]:
# Grafico de heatmap usando seaborn
sns.heatmap(tips.corr(numeric_only=True))
plt.show()

In [None]:
# Utilizando el comando annot puedo ver el valor de correlación entre variables dentro de cada cuadro
sns.heatmap(tips.corr(numeric_only=True), annot = True)
plt.show()

In [None]:
# También puedo cambiarle el mapa de colores con el comando coolwarm
sns.heatmap(tips.corr(numeric_only=True), annot = True, cmap = 'coolwarm')
plt.show()

In [None]:
# Con otro color
sns.heatmap(tips.corr(numeric_only=True), annot = True, cmap = 'YlGnBu')
plt.show()

In [None]:
# Con otro color
sns.heatmap(tips.corr(numeric_only=True), annot = True, cmap = 'Blues')
plt.show()

In [None]:
# Con otro color
sns.heatmap(tips.corr(numeric_only=True), annot = True, cmap = 'BuPu')
plt.show()

In [None]:
# Con otro color
sns.heatmap(tips.corr(numeric_only=True), annot = True, cmap = 'Greens')
plt.show()

In [None]:
# Luego para separar los cuadros y que el gráfico se vea más legible utilizaremos linewidths = 5
sns.heatmap(tips.corr(numeric_only=True), annot = True, cmap = 'Greens', linewidths = 5)
plt.show()

### Resumen Matplotlib y Seaborn

Las posibilidades con Matplotlib y Seaborn son infinitas y dependen mucho de la imaginación y creatividad de cada uno para trabajar con distintos tipos de datos.

Se pueden aprovechar los datasets de ejemplo que fueron integrados en la librería seaborn:

 - https://seaborn.pydata.org/generated/seaborn.load_dataset.html 
 - https://github.com/mwaskom/seaborn-data 

