<div class="alert alert-block alert-info" style="background-color: #301E40; border: 0px; -moz-border-radius: 10px; -webkit-border-radius: 10px;">
<br/><br/>
<h1 style="font-size: 45px; color: white; align: center;"><center>
<img src="https://raw.githubusercontent.com/HumbleData/beginners-data-workshop/master/media/humble-data-logo-white-transparent.png" width="250px" /><br/><br/>
Visualización de datos con matplotlib
</center></h1>
</div>

![](https://matplotlib.org/_static/logo2_compressed.svg)

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Importar pyplot en matplotlib (y pandas)
</h2><br>
</div>

Según la [documentación oficial](https://matplotlib.org/gallery/index.html):

`matplotlib.pyplot` es una colección de funciones de estilo de comando que hacen que Matplotlib funcione como MATLAB. Cada función de pyplot realiza algún cambio en una figura: por ejemplo, crea una figura, crea un área de trazado en una figura, traza algunas líneas en un área de trazado, decora el trazado con etiquetas, etc.

`pyplot` está destinado principalmente a gráficos interactivos y casos simples de generación de gráficos programáticos.

![](https://miro.medium.com/max/2000/1*swPzVFGpYdijWAmbrydCDw.png)

In [None]:
%matplotlib inline
# Esto es para que la intérprete de ipython muestre la trama en Jupyter

import pandas as pd
import matplotlib.pyplot as plt

### Importe el *dataframe* nuevamente, léelo en un *dataframe* de pandas y asígnelo a df.

In [None]:
df = pd.read_csv('../data/Penguins/penguins_clean.csv')

### Refrescar nuestra memoria sobre cómo se ven los datos

In [None]:
df.head()

### Usando DataFrame.plot() en pandas

El objeto pandas DataFrame tiene un método `plot()` que proporciona gráficos básicos de diferentes tipos, que incluyen: 'line'(línea), 'bar'(barra), 'hist', 'box'(caja), etc. También puede establecer parámetros para controlar el diseño y las etiquetas de la trama.

`plot()` usa `matplotlib.pyplot` en segundo plano, lo que facilita mucho el trazado de datos en un DataFrame.

Encontrarás esta página muy útil:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.html

#### Ejemplo: Diagrama de caja en general

In [None]:
df.plot(kind='box')

Las escalas de nuestros datos no se alinean particularmente bien. Entonces, por el bien de la gráfica, ignoraremos la masa corporal de los pingüinos.

In [None]:
df.drop(["body_mass_g"], axis=1).plot(kind='box')

#### Mejor presentación: tamaño de figura, agregar título y leyenda

In [None]:
df.drop(["body_mass_g"], axis=1).plot(kind='box', figsize=(10,8), title='Diagrama de caja de diferentes medidas de especies de pingüinos', legend=True)

#### Haciendo subtramas

In [None]:
df.plot(kind='box',
        subplots=True, layout=(2,2),
        figsize=(10,8), title='Diagrama de caja de diferentes medidas de especies de pingüinos', legend=True)

---

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Ejercicio: Compare la longitud del pico de diferentes especies de pingüinos
</h2><br>
</div>

Usemos un diagrama de caja para comparar la longitud del pico de diferentes especies de pingüinos. Necesitamos que el DataFrame sea ligeramente diferente para que podamos comparar los diferentes tipos de especies de pingüinos. Nos gustaría pivotar los datos para que cada columna tenga la longitud del pico de diferentes especies de pingüinos.

####  Preparar el conjunto de datos

In [None]:
df_pivot = df.pivot(index=None, columns='species', values='bill_length_mm')
# decirle al método pivot() que haga las 'species' como columnas, y usar 'bill_length_mm' como valor

In [None]:
df_pivot.sample(10)

#### Diagrama de caja de df_pivot

Ahora podemos usar `plot()` en `df_pivot`. Para hacer un diagrama de caja, recuerde establecer el parámetro `kind`(tipo) en 'box'(caja). También haga que la presentación sea agradable configurando un buen `figsize` y con un buen `title`. No olvides la `legend`(leyenda).

#### Ejercicio adicional

Ponte a prueba haciendo tu propio pivote `df_pivot` en una medida diferente (por ejemplo, Body Mass). También intenta usar un histograma (hist) en lugar de un diagrama de caja. También puedes intentar hacer una trama con 3 subtramas, cada una es un histograma de un tipo de pingüino.

Hasta ahora no estamos usando `matplotlib.pyplot` directamente. Aunque es muy conveniente usar `df.plot()`, a veces nos gustaría tener más control con lo que estamos trazando y hacer gráficos más complejos. En las siguientes secciones, usaremos `matplotlib.pyplot` (que ahora se importa como `plt`) directamente.

### Divide los datos en 3 tipos en consecuencia

In [None]:
df['species'].unique()

In [None]:
df_adelie = df[df['species'] == 'Adelie']

In [None]:
df_chinstrap = df[df['species'] == 'Chinstrap']

In [None]:
df_gentoo = df[df['species'] == 'Gentoo']

### Ejemplo de diagrama de dispersión: diagrama sobre la longitud y el ancho del billete

In [None]:
plt.scatter(df_adelie['bill_length_mm'], df_adelie['bill_depth_mm'], c='r')
plt.scatter(df_chinstrap['bill_length_mm'], df_chinstrap['bill_depth_mm'], c='g')
plt.scatter(df_gentoo['bill_length_mm'], df_gentoo['bill_depth_mm'], c='b')

### Mejor presentación: tamaño de figura, agregar etiquetas y leyenda

In [None]:
plt.figure(figsize=(10,8)) # establece el tamaño del gráfico

plt.scatter(df_adelie['bill_length_mm'], df_adelie['bill_depth_mm'], c='r')
plt.scatter(df_chinstrap['bill_length_mm'], df_chinstrap['bill_depth_mm'], c='g')
plt.scatter(df_gentoo['bill_length_mm'], df_gentoo['bill_depth_mm'], c='b')

ax = plt.gca() # el método 'gca' le dice al resto del código de utilizar el gráfico que hicimos

ax.set_xlabel('Bill Length (mm)')
ax.set_ylabel('Bill Width (mm)')
ax.set_title('Bill Length and Width for Different Species of Penguin')

ax.legend(('adelie', 'chinstrap', 'gentoo'))

### Ejercicio de diagrama de dispersión: diagrama sobre la longitud de la aleta y la masa corporal

Ahora es tu turno de hacer tu propia trama. Asegúrate de haber configurado también las etiquetas y la leyenda

### Ejemplo de histograma: gráfico sobre la longitud del pico

In [None]:
plt.figure(figsize=(10,8))

plt.hist(df_adelie['bill_length_mm'], color='r', alpha=.5) # 'alpha'(alfa) establece la transparencia de la trama
plt.hist(df_chinstrap['bill_length_mm'], color='g', alpha=.5)
plt.hist(df_gentoo['bill_length_mm'], color='b', alpha=.5)

ax = plt.gca()

ax.set_xlabel('Bill Length (mm)')
ax.set_title('Histogram of Bill Length for Different Species of Penguin')

ax.legend(('adelie', 'chinstrap', 'gentoo'))

### Ejercicio de histograma: diagrama de masa corporal

Ahora es tu turno de hacer tu propia trama. Asegúrate de establecer el alfa en un valor adecuado y tenga las etiquetas y la leyenda correctas.

### Ejemplo de creación de subtramas

Hacer subtramas con solo `plt` es un poco más complicado. Se considera más avanzado y requiere cierta comprensión de cuáles son los componentes básicos en una trama. No te sienta mal si lo encuentras desafiante, siempre puedes seguir el ejemplo y probarlo para entender más lo que está pasando.

El siguiente ejemplo traza el histograma de la longitud y el ancho del billete uno al lado del otro

In [None]:
# Primero, tenemos que decidir cuántas subtramas queremos y cómo están orientadas
# digamos que los queremos uno al lado del otro (es decir, 1 fila 2 columnas)

fig, (ax0, ax1) = plt.subplots(nrows=1, ncols=2, figsize=(15,8))

# esto creará un objeto de figura (que es toda el área de la trama)
# y 2 ejes (que son las 2 subparcelas etiquetadas ax 0 y ax1)

# Ahora podemos poner parcelas en ellas en consecuencia

### para ax0 ###

ax0.hist(df_adelie['bill_length_mm'], color='r', alpha=.5) 
ax0.hist(df_chinstrap['bill_length_mm'], color='g', alpha=.5)
ax0.hist(df_gentoo['bill_length_mm'], color='b', alpha=.5)

ax0.set_xlabel('Longitud del billete (mm)')
ax0.set_title('Histograma de la longitud del pico para diferentes especies de pingüinos')

ax0.legend(('adelie', 'chinstrap', 'gentoo'))

### para ax1 ###

ax1.hist(df_adelie['bill_depth_mm'], color='r', alpha=.5) 
ax1.hist(df_chinstrap['bill_depth_mm'], color='g', alpha=.5)
ax1.hist(df_gentoo['bill_depth_mm'], color='b', alpha=.5)

ax1.set_xlabel('Ancho de la cuenta (mm)')
ax1.set_title('Histograma del ancho del pico para diferentes especies de pingüinos')

ax1.legend(('adelie', 'chinstrap', 'gentoo'))

plt.show() # after building what we want for both axes, use show() method to show plots

---

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Hacer ejercicio de subtramas
</h2><br>
</div>

Haz 2 subtramas, una encima de la otra. Son diagramas de dispersión de la longitud de la aleta y la masa corporal (con diferentes tipos de pingüinos). Después de haberlo hecho, pruebe también con otras orientaciones y parcelas. Vea si puede hacer 4 subtramas juntas. Siempre asegúrese de que la presentación sea buena.

---

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
¡Más matplotlib!
</h2><br>
</div>

Vea más ejemplos de histograma con múltiples conjuntos de datos:
https://matplotlib.org/gallery/statistics/histogram_multihist.html#sphx-glr-gallery-statistics-histogram-multihist-py

Ejemplo: crea un histograma a partir de un diagrama de dispersión y los agrega a los lados del diagrama
https://matplotlib.org/gallery/lines_bars_and_markers/scatter_hist.html#sphx-glr-gallery-lines-bars-and-markers-scatter-hist-py

Hay mucho más que aprender sobre matplotlib. Es una biblioteca muy potente. Siempre puede aprender más mirando los ejemplos en: https://matplotlib.org/gallery/index.html

Además, si está atascado, siempre consulte la documentación: https://matplotlib.org/api/_as_gen/matplotlib.pyplot.html#module-matplotlib.pyplot

![](https://media0.giphy.com/media/l3nF8lOW9D0ZElDvG/200.gif)