<div class="alert alert-block alert-info" style="background-color: #301E40; border: 0px; -moz-border-radius: 10px; -webkit-border-radius: 10px;">
<br/><br/>
<h1 style="font-size: 45px; color: white; align: center;"><center>
<img src="https://raw.githubusercontent.com/HumbleData/beginners-data-workshop/master/media/humble-data-logo-white-transparent.png" width="250px" /><br/><br/>
Visualización de datos con Seaborn
</center></h1>
</div>

## Acerca de Seaborn
Seaborn es una biblioteca de visualización de datos de Python basada en matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos, que es muy potente para visualizar datos categóricos.

![](https://d1rwhvwstyk9gu.cloudfront.net/2017/07/seaburn-1.png)

Usaremos el [Pokemon.csv](https://gist.github.com/armgilles/194bcff35001e7eb53a2a8b441e8b2c6). 
Echemos un vistazo a los datos:

In [None]:
import pandas as pd

pokemon_df = pd.read_csv('../data/Pokemon/pokemon.csv', index_col=0)
pokemon_df.head(10)

---

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Diagramas de dispersión categóricos
</h2><br>
</div>

Por ejemplo, queremos comparar el Ataque de diferentes tipos de Pokémon, para ver si algún tipo es generalmente más poderoso que los demás:

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

sns.catplot(x="Type 1", y="Attack", data=pokemon_df);

Al importar, generalmente simplificamos 'seaborn' como 'sns'. (¡Es una referencia de [West Wing / Rob Lowe](https://es.wikipedia.org/wiki/Sam_Seaborn)!) Tenga en cuenta que también debemos importar matplotlib.pyplot porque Seaborn es una biblioteca que se encuentra encima de matplotlib. Tenemos una trama, pero se ve fea y no se puede leer, agreguemos alguna configuración para que sea más agradable.

**Intenta: agregar `aspect=2.5` como los últimos argumentos en el siguiente `sns.catplot`**

In [None]:
sns.catplot(x="Type 1", y="Attack", data=pokemon_df);

Entonces puedes ver que al agregar 'aspect'(aspecto) hacemos que la trama sea más amplia. El ancho de la trama es igual a 'aspect * height'(aspecto * altura), por lo que al agregar 'aspect' aumentamos el ancho de la trama. Es una de las configuraciones que podemos añadir a la trama. Para ver la lista completa y sus detalles, podemos consultar la [documentación oficial](https://seaborn.pydata.org/generated/seaborn.catplot.html#seaborn.catplot) pero daremos una introducción a algunos comunes unos.

Por ejemplo, aquí vemos que hay un desplazamiento aleatorio del eje x para todos los puntos para que podamos verlos sin que los puntos se superpongan entre sí. Esto se hace mediante la configuración de 'jitter', que por defecto es True. Apaguémoslo y veamos cómo se ve:

**Intenta: agregar `jitter=False` como los últimos argumentos en el siguiente `sns.catplot`**

In [None]:
sns.catplot(x="Type 1", y="Attack", data=pokemon_df, aspect=2.5);

Así que ahora tenemos un gráfico en el que los puntos se alinean según sus categorías sin las compensaciones del eje x. Cuál usar depende de si la población del valor (por ejemplo, Ataque) es importante. En nuestro caso, queremos saber cómo se distribuye el Ataque en cada Tipo tanto si es bueno tener activado el 'jitter', o mejor aún si podemos distribuirlo aún más y mostrar la distribución:

**Intenta: agregar `kind="swarm"` como los últimos argumentos en el siguiente `sns.catplot`**

In [None]:
sns.catplot(x="Type 1", y="Attack", data=pokemon_df, aspect=2.5);

Aquí podemos hacerlo configurando 'kind'(tipo) en 'swarm'(enjambre) para que los puntos no se superpongan. La desventaja es que esta estratagema necesitará más espacio horizontalmente. Imagina que no queremos que la trama sea muy ancha debido a la limitación del papel. Podemos girarlo 90 grados girando la x y la y, también ajustaríamos el aspecto y la altura:

**Intenta: intercambie `x` e `y`, y agregue `height=12, aspect=0.6, kind="swarm"` en los argumentos del siguiente `sns.catplot`**

In [None]:
sns.catplot(x="Type 1", y="Attack", data=pokemon_df);

Hay algunas cosas que podemos observar hasta ahora:

1. Para algunos Tipos, como "Psychic", tiene un rango de Ataque muy amplio con una cola larga al final (es decir, algunos Tipos Físicos tienen un poder de Ataque muy alto, mientras que la mayoría de los Tipos Psíquicos no lo tienen).

2. Por otro lado, los de tipo Veneno están mayormente en el rango de 40-110 Ataques.

3. En general, los tipos de dragón tienen más poder de ataque que las hadas, pero hay 2 tipos de hadas que tienen más poder de ataque.

Sin embargo, nos gustaría profundizar más: tengo la teoría de que los Pokémon legendarios son más poderosos. vamos a codificar por colores según 'Legendary' para ver si el pokemon es Legendario o no tendrá algo que ver con el Ataque del pokemon:

**Intenta: agregar `hue="Legendary"` como los últimos argumentos en el siguiente `sns.catplot`**

In [None]:
plt.figure(figsize=(15, 6))
sns.stripplot(x="Type 1", y="Attack", data=pokemon_df, size=7)

¡Ajá! Vemos que muchos de los Tipos Psíquicos que tienen un Ataque más alto que otros son en realidad Pokémon Legendarios. Eso también sucede con el Tipo Tierra y el tipo Volador.

### Ejercicio
Ahora es tu turno de hacer un poco de análisis. Elige una propiedad del Pokémon: HP, Defense, Sp. atk, esp. Def o Speed y haz un análisis similar al anterior para ver si puedes encontrar datos interesantes sobre Pokémon.

---

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Construcción de cuadrículas estructuradas de múltiples parcelas
</h2><br>
</div>

A veces, tendríamos varias parcelas en un gráfico para comparar. Una forma de hacerlo en seaborn es usar FacetGrid. La clase FacetGrid es útil cuando desea visualizar la distribución de una variable o la relación entre múltiples variables por separado dentro de subconjuntos de su conjunto de datos. A continuación, usaremos FacetGrid para ver si hay alguna diferencia en nuestro análisis anterior entre diferentes generaciones.

Para hacer un FacetGrid, podemos hacer lo siguiente:

In [None]:
g = sns.FacetGrid(pokemon_df, col="Generation")

Mira, tenemos 6 áreas de parcela que coinciden con el número de generaciones diferentes que tenemos.
(podemos comprobar cuáles son las diferentes Generaciones así):

In [None]:
pokemon_df["Generation"].unique()

Sin embargo, nos gustaría que los gráficos se alinearan verticalmente en lugar de horizontalmente.

**Intenta: reemplace `col` con `row` en el siguiente `sns.FacetGrid`**

In [None]:
g = sns.FacetGrid(pokemon_df, col="Generation")

Ok, ahora que tenemos el diseño, ¿cómo vamos a poner la trama? Para algunas gráficas, podría hacerse con el método [FacetGrid.map()](https://seaborn.pydata.org/generated/seaborn.FacetGrid.map.html#seaborn.FacetGrid.map), por ejemplo, usando `sns.countplot` para contar cuántos Pokémon en diferentes tipos:

In [None]:
g = sns.FacetGrid(pokemon_df, row="Generation", aspect=3.5)
g.map(sns.countplot, "Type 1");

Pero con `sns.catplot` que usamos antes, esto es aún más simple. Como catplot ya es un FacetGrid, podemos agregarle directamente la configuración `row` o `col`.

**Intenta: agregar `row="Generation"` como los últimos argumentos en el siguiente `sns.catplot`**

In [None]:
plt.figure(figsize=(15, 6))
sns.stripplot(x="Type 1", y="Attack", data=pokemon_df, size=7, hue="Legendary")

Ahora ves que en cada generación, los Pokémon legendarios son atípicos con superpoderes de ataque en comparación con los demás dentro de su propia generación. Para obtener detalles sobre el uso de FacetGrids, puede consultar la documentación oficial aquí: https://seaborn.pydata.org/tutorial/axis_grids.html