---
<font size="6"><center>Matplotlib</font></center>

La librería de funciones [`matplotlib`](http://matplotlib.org/) es la más común de todas. Podemos hacer gráficos con pocas líneas de código y su utilidad es de las más instuitivas de todas.


*   Aquí el [link](http://matplotlib.org/api/pyplot_api.html) a la documentación.
*   Para más detalle, en este [link](http://matplotlib.org/gallery.html#statistics) hay muchos ejemplos de distintos tipos de gráficos



---

# Instalación e importación
El proceso de instalación y cómo lo llamaremos lo haremos de la siguiente manera

In [1]:
# --
# Instalación
# --
!pip install matplotlib

Collecting matplotlib
  Downloading matplotlib-3.5.1-cp310-cp310-win_amd64.whl (7.2 MB)
     ---------------------------------------- 7.2/7.2 MB 28.8 MB/s eta 0:00:00
Collecting pillow>=6.2.0
  Downloading Pillow-9.0.1-cp310-cp310-win_amd64.whl (3.2 MB)
     ---------------------------------------- 3.2/3.2 MB 41.4 MB/s eta 0:00:00
Collecting kiwisolver>=1.0.1
  Downloading kiwisolver-1.3.2-cp310-cp310-win_amd64.whl (52 kB)
     ---------------------------------------- 52.1/52.1 KB ? eta 0:00:00
Collecting fonttools>=4.22.0
  Downloading fonttools-4.29.1-py3-none-any.whl (895 kB)
     ------------------------------------- 895.5/895.5 KB 55.3 MB/s eta 0:00:00
Collecting cycler>=0.10
  Downloading cycler-0.11.0-py3-none-any.whl (6.4 kB)
Installing collected packages: pillow, kiwisolver, fonttools, cycler, matplotlib
Successfully installed cycler-0.11.0 fonttools-4.29.1 kiwisolver-1.3.2 matplotlib-3.5.1 pillow-9.0.1


Dentro de la librería de matplotlib, para acceder a los gráficos directamente, traeremos el paquete de funciones de pyplot.

Se suele llamar como `plt`

In [None]:
from matplotlib import pyplot as plt

O directamente

In [None]:
# --
# Importación
# --
import matplotlib.pyplot as plt

# Gráfico de líneas

Es el gráfico por defecto y el que más se suele utilizar para ver los datos rápidamente.

In [None]:
# --
# Definimos los datos
# --
eje_x = [1, 2, 3, 4, 5, 6, 7, 8, 9]
eje_y = [1, 3, 5, 3, 1, 3, 5, 3, 1]

Ahora, llamamos a la función`.plot` la cual va a recibir los siguientes argumentos:


*   `x`: Eje X. Opcional
*   `y`: Eje y
*   `fmt`: Formato del gráfico en cuanto a los puntos, líneas y colores ('[marker][line][color]') . Opcional
*   Inputs de formato de las líneas opcionales. Los más usuales:
  * `label`: Para nombrar cada línea
  * `color`: Color en formato numérico si fuera necesario
  * `linewidth`: Ancho de línea
  * `markersize`: Tamaño de los puntos

**Importante terminar siempre con el comando `plt.show()`**









Hagamos el gráfico más sencillo posible.

In [None]:
# --
# Sólo necesitamos informar el set de datos del eje y
# --
plt.plot(eje_y)
plt.show()

Démosle más formato poco a poco. Primero, informando el eje X.

In [None]:
# --
# Informamos eje x
# --
plt.plot(eje_x, eje_y)
plt.show()

Pongamos como formato de línea unos círculos. Para ello usamos uno de los siguientes identificadores:


> Formato de puntos


tecla | descripción
--- | ---
<center>.   | <center> Puntos
<center>,   | <center> Pixel
<center>o   | <center> Círculo
<center>v   | <center> Triángulo_Abajo
<center>^   | <center>Triángulo_Arriba
<center><   | <center> Triángulo_Izquierda
<center>>   | <center> Triángulo_Derecha
<center>1   | <center> "Aspa" hacia abajo
<center>2   | <center> "Aspa" hacia arriba
<center>3   | <center> "Aspa" hacia la izqueirda
<center>4   | <center> "Aspa" hacia la derecha
<center>s   | <center> Cuadrado
<center>p   | <center> Pentágono
<center>*   | <center> Asterisco
<center>h   | <center> Hexágono (1)
<center>H   | <center> Hexágono (2)
<center>+   | <center> Signo más
<center>x   | <center> Signo x
<center>D   | <center> Diamante
<center>d   | <center> Diamante pequeño
<center>_   | <center> Barra baja





In [None]:
# --
# Informamos eje x y su marcador
# --
plt.plot(eje_x, eje_y,'o')
plt.show()

Unamos esas líneas con uno de los siguientes formatos:

> Formato de línea


tecla | descripción
--- | ---
<center>-   | <center> Línea sólida
<center>--  | <center> Línea discontínua
<center>-.  | <center> Línea-punto
<center>:   | <center> Punteada



In [None]:
# --
# Informamos eje x, su marcador y su línea
# --
plt.plot(eje_x, eje_y,'o--')
plt.show()

Y, por último, démosle color.

> Formatos de color

código | descripción
--- | ---
<center>b   | <center> Azul
<center>g  | <center> Verde
<center>r  | <center> Rojo
<center>c   | <center> Cyan
<center>m   | <center> Magenta
<center>y   | <center> Amarillo
<center>k   | <center> Negro
<center>w   | <center> Blanco

In [None]:
# --
# Informamos eje x, su marcador, su línea y su color
# --
plt.plot(eje_x, eje_y,'o--r')
plt.show()

Usemos algunos argumentos opcionales vistos anteriormente.

In [None]:
# --
# Terminamos de formatear. Haremos:
#    - color: Afi
#    - alpha: trasparencia
#    - linewidth: Ancho de la línea
#    - markersize: tamaño de los datos
# --

plt.plot(eje_x, eje_y,'o--', color = (216/255, 69/255, 25/255), alpha = 0.3, linewidth=5, markersize=15)
plt.show()

Si queremos incluir varias series en el mismo gráfico, basta con configurar cada serie y terminar con el comando `plt.show()`

In [None]:
# --
# Definimos los nuevos datos
# --
import numpy as np
eje_x_bis = eje_x
eje_y_bis = np.sin(eje_y)

# --
# Definimos primero una serie y luego la segunda
# --

# Primera serie
plt.plot(eje_x, eje_y,'o--', color = (216/255, 69/255, 25/255), alpha = 0.3, linewidth=5, markersize=15)

# Segunda serie
plt.plot(eje_x_bis, eje_y_bis,'*-g', alpha = 0.5, linewidth=3, markersize=10)

# Terminamos
plt.show()

## Ejemplo COVID-19

Cargamos los datos correspondientes

In [None]:
import pandas as pd
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

covid = pd.read_csv('covid_19_2020.csv', sep = ';')
covid.head(5)

Nos quedamos con los datos para España

In [None]:
spain = covid[covid['countriesAndTerritories'] == 'Spain']
spain['Date'] = spain['dateRep'].apply(lambda x: datetime.strptime(x,"%d/%m/%Y"))
spain = spain.sort_values('Date')
spain.set_index('Date', inplace = True)
spain.head(20)

In [None]:
x_values = spain.index
y_values = spain.CumulativeRate
plt.plot(x_values, y_values)

Comparamos la evolución de España con Italia

In [None]:
italy = covid[covid['countriesAndTerritories'] == 'Italy']
italy['Date'] = italy['dateRep'].apply(lambda x: datetime.strptime(x,"%d/%m/%Y"))
italy = italy.sort_values('Date')
italy.set_index('Date', inplace = True)
italy.head(20)

In [None]:
# Definimos primero una serie y luego la segunda
# --

# Primera serie
x_values = spain.index
y_values = spain.CumulativeRate
plt.plot(x_values, y_values,'o-', color = (216/255, 69/255, 25/255), alpha = 0.3, linewidth=5, markersize=10)

# Segunda serie
x_values = italy.index
y_values = italy.CumulativeRate
plt.plot(x_values, y_values,'*-g', alpha = 0.5, linewidth=3, markersize=10)

# Terminamos
plt.show()

# Gráfico de columnas

Su implementación es muy sencilla y prácticamente igual que el gráfico de línea

In [None]:
# --
# Definimos los datos
# --
eje_x_col1 = [1, 3, 4, 5, 6, 7, 9]
eje_y_col1 = [4, 7, 2, 4, 7, 8, 3]

Ahora, llamamos a la función`.bar` la cual va a recibir los siguientes argumentos:


*   `x`: Eje X
*   `heigth`: Altura de las columnas
*   `width`: Ancho de las columnas. Opcional
*   `bottom`: Número inicial del eje Y. Opcional 
*   `align`: Barras centradas (center) o alineadas a la izquierda (edge). Opcional
*   Inputs de formato de las columnas. Los más usuales:
  * `label`: Para nombrar cada serie
  * `alpha`: Transparencia de las columnas
  * `edgecolor`: Color del borde de las columnas
  * `linewidth `: Ancho de línea del borde de las columnas. Poner 0 para quitarlas


**Importante terminar siempre con el comando `plt.show()`**

In [None]:
# --
# Gráfico de columnas básico
# --
plt.bar(eje_x_col1, eje_y_col1)
plt.show()

**Nota**

Utilizar el comando `plt.barh` para verlo en horizontal

In [None]:
# --
# Gráfico de barras formateado
# --
plt.barh(eje_x_col1, eje_y_col1)
plt.show()

Directamente, formateamos el gráfico.

In [None]:
# --
# Gráfico de barras formateado
# --
plt.bar(eje_x_col1, eje_y_col1, width = 0.7, bottom = 1, align = 'center',
        color = (216/255,69/255,25/255), 
        label = 'Barras 1', 
        edgecolor = 'b', 
        linewidth = 10, 
        alpha = 0.3)
plt.show()

Si queremos 2 series, al igual que en el gráfico de líneas, es suficiente con parametrizar ambas una detrás de otra y graficar.

In [None]:
# --
# Definimos los datos nuevos
# --
eje_x_col2 = [2, 4, 6, 8, 10]
eje_y_col2 = [5, 6, 2, 6, 2]

# --
# Definimos primero una serie y luego la segunda
# --

# Primera serie
plt.bar(eje_x_col1, eje_y_col1, width = 0.7, align = 'center',
        color = (216/255,69/255,25/255), 
        label = 'Barras 1', 
        edgecolor = 'b', 
        linewidth = 10, 
        alpha = 0.3)

# Segunda serie
plt.bar(eje_x_col2, eje_y_col2, width = 0.3, align = 'center',
        color = (216/255,69/255,25/255), 
        label = 'Barras 1')
plt.show()
# Graficamos

## Ejemplo COVID-19

Veámos la distribución de casos y muertes en el mundo por meses

In [None]:
covid_mean = covid.groupby('month', as_index = False)['cases','deaths'].sum()

plt.bar(covid_mean.month, covid_mean.cases)
plt.bar(covid_mean.month, covid_mean.deaths*10) # Para cambiar rápidamente de escala, multiplicamos por 10

plt.show()

# Histograma

Veremos la manera práctica de crear un histograma de cero.

In [None]:
# --
# Definimos el set de datos
# --
import numpy as np
n = np.random.randn(1000)
m = [m for m in range(len(n))]

# --
# Primera aproximación: ver los datos con gráfico de columnas
# --
plt.bar(m,n)
plt.show()

Para utilizar la función `.hist` necesitamos definir los siguientes argumentos:


*   `x`: Valores
*   `bins`: Número de elementos en el eje x. Opcional
*   `cumulative`: Frecuencias acumuladas. Opcional

El resto de parámetros son muy aprecidos a los ya vistos hasta este punto de la documentación



In [None]:
# --
# Creamos el histograma con 20 representantes
# --
plt.hist(n, bins = 20)
plt.show()

In [None]:
# --
# Creamos el histograma acumulado con 20 representantes
# --
plt.hist(n, bins = 20, cumulative = True)
plt.show()

# Diagrama de puntos
Veremos la manera práctica de crear un diagrama de puntos (scatter plot) desde cero.

In [None]:
# --
# Definimos los datos
# --
x1 = [2, 3, 4]
y1 = [5, 5, 5]

x2 = [1, 2, 3, 4, 5]
y2 = [2, 3, 2, 3, 4]

Para utilizar la función `.scatter` necesitamos definir los siguientes argumentos:


*   `x`: Valores del eje x
*   `y`: Valores del eje y

En cuanto a los argumentos opcionales, los más usuales son:

*    `s`: Tamaño
*    `c`: Color
*    `marker`: Formato del punto
*   `alpha`: Transparencia



In [None]:
# --
# Creamos uno sencillo
# --
plt.scatter(x1,y1)
plt.show()

Ahora, crearemos el gráfico para dos series de datos y les daremos formato

In [None]:
# --
# Primera serie
# --
plt.scatter(x1, y1, marker='v', color=(216/255,69/255,16/255))

# --
# Segunda serie
# --
plt.scatter(x2, y2, marker='^', color='m')

# --
# Graficamos
# --
plt.show()

# Gráfico de tarta
Veremos la forma sencilla de crear un gráfico de tarta de cero

In [None]:
# --
# Definimos los datos
# --
etiquetas = 'S1', 'S2', 'S3'
valores = [56, 66, 24]
colores = ['c', 'g', 'y']

Usamos la función `.pie` en la cual tenemos que informar de:


*   `x`: Valores del gráfico. Se mostrarán en porcentaje
*   `labels`: Etiquetas. Opcional
*   'colors`: Colores. Opcional
*   `explode`: Separación. Opcional
*   `autopct`: Formato del porcentaje. Opcional




In [None]:
# --
# Creamos un gráfico sencillo
# --
plt.pie(valores)
plt.show()

Damos formato

In [None]:
# --
# Formateamos el gráfico en base a los valores dados anteriormente
# --
plt.pie(x = valores,
        explode = (0,0.1,0),
        labels = etiquetas, 
        colors = colores, 
        autopct = '%1.2f%%')
plt.show()

# Stack Plot
Para un gráfico de paneles solapados, usaremos la función `stackplot`.

In [None]:
# --
# Definimos los datos
# --
eje_x_stack = [ 1,  2,  3,  4,  5,  6,  7,  8,  9]
serie_1  = [23, 40, 28, 43,  8, 44, 43, 18, 17]
serie_2  = [17, 30, 22, 14, 17, 17, 29, 22, 30]
serie_3  = [15, 31, 18, 22, 18, 19, 13, 32, 39]

Para graficar, es tan sencillo como poner en el primer argumento los valores del eje x y luego ir añadiendo el resto de series.

In [None]:
# --
# Gráfico de paneles
# --
plt.stackplot(eje_x_stack, serie_1, serie_2, serie_3)
plt.show()

# Rellenar entre dos series

Alguna vez, para hacer gráficos más completos, usaremos el comando que se ve a continuación para rellenar con un color dos series de datos.

In [None]:
# --
# Definimos los datos
# --

eje_x = [1,2,3,4,5,6,7,8,9,10]
eje_y1 = np.sin(eje_x)
eje_a1 = [0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,]
eje_a2 = [-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,]

Creamos el gráfico de línea con la primera serie y luego, antes de graficar, usaremos el comando `.fill_between` para definir las dos bandas y su color.

In [None]:
# --
# Graficamos la línea de la serie 1
# --
plt.plot(eje_x, eje_y1, color = (18/255, 75/255, 87/255))

# --
# Usamos el comando .fill_between
# --
plt.fill_between(eje_x, eje_a1, eje_a2, color = (255/255, 220/255, 208/255), alpha=0.5)

# --
# Graficamos
# --
plt.show()

# Subplots
Es muy frecuente querer mostrar 2 gráficos en una misma sección. Para ello, usamos el comando `.subplot2grid`

In [None]:
# --
# Definimos los datos
# --
eje_x = [1,2,3,4,5,6,7,8,9,10]

eje_y1 = [np.random.randint(10) for i in range(10)]
eje_y2 = [np.random.randint(10) for i in range(10)]
eje_y3 = [np.random.randint(10) for i in range(10)]
eje_y4 = [np.random.randint(10) for i in range(10)]

Inputs de la función `.subplot2grid`:


*   `shape`: Tamaño del grid completo. Tupla de 2 elementos eneteros.
*   `loc`: Localización del gráfico en cuestión
*   `rowspan`: Número de filas que ocupa este gráfico
*   `colspan`: Número de columnas que ocupa este gráfico

Primero se define una variable y luego se utiliza el comando `.plot`(por ejemplo) sobre cada uno de ellos.



In [None]:
# --
# Primero definimos el grid de los gráficos
# --
ax1 = plt.subplot2grid((5,2),(0,0), rowspan = 1, colspan = 2)
ax2 = plt.subplot2grid((5,2),(1,0), rowspan = 3, colspan = 2)
ax3 = plt.subplot2grid((5,2),(4,0), rowspan = 1, colspan = 1)
ax4 = plt.subplot2grid((5,2),(4,1), rowspan = 1, colspan = 1)

# --
# Definimos el plot que queremos
# --
ax1.plot(eje_x,eje_y1)
ax2.bar(eje_x,eje_y2)
ax3.plot(eje_x,eje_y3)
ax4.plot(eje_x,eje_y4)

# --
# Graficamos
# --
plt.show()

#Formatear el gráfico
Lo que queda por mostrar es cómo poder dar formato al propio gráfico. Lo haremos sobre el gráfico de línea, por ejemplo.

In [None]:
# --
# Definimos los datos
# --
eje_x = [1, 2, 3, 4, 5, 6, 7, 8, 9]
eje_y = [1, 3, 5, 3, 1, 3, 5, 3, 1]

eje_x_bis = eje_x
eje_y_bis = np.sin(eje_y)

# --
# Definimos primero una serie y luego la segunda
# --

# Primera serie
plt.plot(eje_x, eje_y,'o--', color = (216/255, 69/255, 25/255), alpha = 0.3, linewidth=5, markersize=15, label = 'Línea 1')

# Segunda serie
plt.plot(eje_x_bis, eje_y_bis,'*-g', alpha = 0.5, linewidth=3, markersize=10, label = 'Línea 2')

# Terminamos
plt.show()

Ahora, mostramos cómo poder dar un formato más completo al conjunto del gráfico:


*   `plt.legend`: Muestra la leyenda. Se puede formatear
*   `plt.title`: Se introduce un input que será el título del gráfico. Se puede formatear.
*   `plt.xlim`: Define los límites del eje x
*   `plt.xlabel`: Etiqueta del eje x
*   `plt.ylabel`: Etiqueta del eje y
*   `plt.annotations`: Etiqueta de un valor. Más documentación [aquí](https://matplotlib.org/3.1.1/tutorials/text/annotations.html).
*   `plt.grid`: Grid del gráfico.
*   `plt.xticks`: Formatear el eje X

Más información de las propiedades de gráficos en el [link](https://matplotlib.org/3.1.1/api/_as_gen/matplotlib.pyplot.html).



In [None]:
# --
# Definimos los datos
# --
eje_x = [1, 2, 3, 4, 5, 6, 7, 8, 9]
eje_y = [1, 3, 5, 3, 1, 3, 5, 3, 1]

eje_x_bis = eje_x
eje_y_bis = np.sin(eje_y)

# --
# Definimos primero una serie y luego la segunda
# --

# Primera serie
plt.plot(eje_x, eje_y,'o--', color = (216/255, 69/255, 25/255), alpha = 0.3, linewidth=5, markersize=15, label = 'Línea 1')

# Segunda serie
plt.plot(eje_x_bis, eje_y_bis,'*-g', alpha = 0.5, linewidth=3, markersize=10, label = 'Línea 2')

#--
# Incorporamos leyenda
# --
plt.legend(frameon=True, loc=1, ncol=1, fontsize=10, borderpad=.6)

# --
# Incorporamos el título
# --
plt.title('Ejemplo de dos líneas', fontSize=15)

# --
# Ajustamos el eje X
# --
plt.xlim(0,10)

# --
# Etiqueta de los ejes
# --
plt.xlabel('eje X', fontSize=12)
plt.ylabel('eje Y', fontSize=12)


# --
# Anotamos un dato
# --
plt.annotate('Ejemplo', xy=(2, 0), xytext=(3, 0.5),
            arrowprops=dict(facecolor='black', shrink=0.05),
            )

# --
# Aplicamos el grid
# --
plt.grid(which = 'both',alpha = 0.3)

# --
# Formateamos el eje X
# --
plt.xticks(np.arange(10), ('Cero', 'Uno', 'Dos', 'Tres', 'Cuatro', 'Cinco', 'Seis', 'Siete', 'Ocho', 'Nueve'), rotation=70)

# Terminamos
plt.show()

## Ejemplo COVID-19

In [None]:
# Definimos primero una serie y luego la segunda
# --

# Primera serie
x_values = spain.index
y_values = spain.CumulativeRate
plt.plot(x_values, y_values,'o-', color = (216/255, 69/255, 25/255), alpha = 0.3, linewidth=5, markersize=10, label = 'España')

# Segunda serie
x_values2 = italy.index
y_values2 = italy.CumulativeRate
plt.plot(x_values2, y_values2,'*-g', alpha = 0.5, linewidth=3, markersize=10, label = 'Italia')

#--
# Incorporamos leyenda
# --
plt.legend(frameon=True, loc='upper left', ncol=1, fontsize=10, borderpad=.6)

# --
# Incorporamos el título
# --
plt.title('Comparativa España - Italia', fontSize=15)


# --
# Etiqueta de los ejes
# --
plt.xlabel('Fecha', fontSize=12)
plt.ylabel('Ratio de casos por 100.000 hab', fontSize=12)


# --
# Anotamos un dato
# --
plt.annotate('Máximo España', xy=(spain.loc[spain.CumulativeRate == np.nanmax(spain.CumulativeRate)].index[0],
                               spain.loc[spain.CumulativeRate == np.nanmax(spain.CumulativeRate)].CumulativeRate[0]),
                           xytext=(spain.loc[spain.CumulativeRate == np.nanmax(spain.CumulativeRate)].index[0],
                               spain.loc[spain.CumulativeRate == np.nanmax(spain.CumulativeRate)].CumulativeRate[0] - 200),
            arrowprops=dict(facecolor='black', shrink=0.05),
            )

plt.annotate('Máximo Italia', xy=(italy.loc[italy.CumulativeRate == np.nanmax(italy.CumulativeRate)].index[0],
                               italy.loc[italy.CumulativeRate == np.nanmax(italy.CumulativeRate)].CumulativeRate[0]),
                           xytext=(italy.loc[italy.CumulativeRate == np.nanmax(italy.CumulativeRate)].index[0],
                               italy.loc[italy.CumulativeRate == np.nanmax(italy.CumulativeRate)].CumulativeRate[0] - 200),
            arrowprops=dict(facecolor='black', shrink=0.05),
            )

# --
# Aplicamos el grid
# --
plt.grid(which = 'both',alpha = 0.3)


# Terminamos
plt.show()