# Matplotlib

**`matplotlib`** es una biblioteca para la generación de gráficos a partir de datos contenidos en **`listas`** o **`arrays`**.

```python
import matplotlib.pyplot as plt
```

Para generar las gráficas más comunes tenemos los siguientes métodos:

|Función            | Plot                         |
|-------------------|------------------------------|
|**`plt.plot()`**   | Grafica **X vs Y** (lineal). |
|**`plt.scatter()`**| Graficas de dispersión.      |
|**`plt.bar()`**    | Grafico de barras vertical.  |
|**`plt.barh()`**   | Grafico de barras horizontal.|


Graficos estadísticos:

|Función               |Plot               |
|----------------------|-------------------|
|**`plt.hist()`**      | Histogramas.      |
|**`plt.boxplot()`**   | Grafico de cajas. |
|**`plt.violinplot()`**| Grafico de violin.|
|**`plt.pie()`**       | Diagrama circular.|

In [None]:
import numpy as np
import pandas as pd

import matplotlib.pyplot as plt

### plt.plot()

**`plt.plot`** hace gráficas de **X vs Y**, por lo que necesitamos una lista de valores para **X** y una para **Y**.

In [None]:
# En este ejemplo voy a generar 2 listas: 1 con np.linspace() y otra aleatoria

X = np.linspace(0, 10, 20)
Y = np.random.randint(0, 40, 20)

for x, y in zip(X, Y):
    print(x, y)

In [None]:
plt.plot(X, Y)
plt.show()

In [None]:
# Podemos hacer uso de numpy para graficar funciones:

# Funcion coseno

X = np.linspace(0, 20, 100)
Y = np.cos(X)

plt.plot(X, Y)
plt.show()

In [None]:
# Función cuadrática:

X = np.linspace(-20, 20, 20)
Y = X**2

plt.plot(X, Y)
plt.show()

In [None]:
# Podemos tener varios .plot() en un mismo plot.

X = np.linspace(-5, 5, 20)
Y1 = X**2
Y2 = X**3

# Plot de X**2
plt.plot(X, Y1)

# Plot de X**3
plt.plot(X, Y2)

plt.show()

# Personalizar plt.plot()

La función **`plt.plot()`** tiene varios parámetros que podemos utilizar para agregar colores y estilos al plot.

In [None]:
X = np.linspace(-5, 5, 20)
Y = np.random.randint(0, 20, 20)

In [None]:
plt.plot(X, Y)

plt.show()

In [None]:
plt.plot(X, Y, color = "green", marker = "*", markersize = 12, linestyle = "dashed", linewidth = 4, alpha = 0.5)

plt.show()

### plt.scatter()

**`plt.scatter()`** hace gráficas de dispersion de **X** vs **Y**, por lo que necesitamos una lista de valores para **X** y una para **Y**.

In [None]:
# Voy a generar 2 listas aleatorias

X = np.random.random(100)
Y = np.random.random(100)

plt.scatter(X, Y)
plt.show()

### Personalizar plt.scatter()

In [None]:
plt.scatter(X, Y, marker = "o", color = "red", edgecolors = "blue", alpha = 0.5, s = 60, linewidths = 5)
plt.show()

### plt.bar() y plt.barh()
**`plt.bar()`** y **`plt.barh()`** hacen gráficas de barras de **X** con una lista de etiquetas, por lo que necesitamos una lista de valores para **X** y una lista de etiquetas.

In [None]:
# Voy a generar una lista aleatoria

# plt.bar()

X = np.random.randint(0, 1000, 5)
etiquetas = ["a", "b", "c", "d", "e"]


plt.bar(etiquetas, X)
plt.show()

In [None]:
# Voy a generar una lista aleatoria

# plt.barh()

X = np.random.randint(0, 1000, 5)
etiquetas = ["a", "b", "c", "d", "e"]


plt.barh(etiquetas, X)
plt.show()

### Personalizar plt.bar() y plt.barh()

In [None]:
# Voy a generar una lista aleatoria

# plt.bar()

X = np.random.randint(0, 1000, 5)
etiquetas = ["a", "b", "c", "d", "e"]


plt.bar(etiquetas, X, width = 0.3, align = "edge", color = "yellow", edgecolor = "purple", linewidth = 3, alpha = 0.4)
plt.show()

In [None]:
# Voy a generar una lista aleatoria

# plt.barh()

X = np.random.randint(0, 1000, 5)
etiquetas = ["a", "b", "c", "d", "e"]


plt.barh(etiquetas, X, height = 0.3, align = "edge", color = "yellow", edgecolor = "purple", linewidth = 3, alpha = 0.4)
plt.show()

# Cambio de width por height

## Hacer plots con bucles

In [None]:
# Bucle for para mostrar 6 plots

X = np.linspace(-5, 5, 20)
Y = X

for k, c in enumerate(["green", "blue", "red", "black", "brown", "magenta"]):
    plt.plot(X, Y**(k + 1), color = c)  
    plt.show()

## Subplots

**`subplot`** es una función para hacer graficas en una **"malla"** o **"matriz"**.

In [None]:
X = np.linspace(-5, 5, 20)
Y = X

# Como parametros de entrada para subplot vamos a tener 3 diferentes: num filas, num de col, el num de la grafica

plt.figure(figsize = (12, 8))

plt.subplot(2, 3, 1)  
plt.plot(X, Y**1, color = "green")  

plt.subplot(2, 3, 2)  
plt.plot(X, Y**2, color = "blue")  

plt.subplot(2, 3, 3)  
plt.plot(X, Y**3, color = "red") 

plt.subplot(2, 3, 4)  
plt.plot(X, Y**4, color = "magenta") 

plt.subplot(2, 3, 5)  
plt.plot(X, Y**5, color = "black") 

plt.subplot(2, 3, 6)  
plt.plot(X, Y**6, color = "brown") 

plt.show()  

**Otra forma de utilizar los `subplots`:**

In [None]:
# Creamos la figura "fig" donde se le van agregar 3 subplots utilizando la variable "ax"

fig, ax = plt.subplots(nrows = 3, ncols = 1, figsize = (6,6))


x = np.linspace(0, 10, 100)

ax[0].plot(x, np.sin(x))   

ax[1].plot(x, np.cos(x))

ax[2].plot(x, np.tan(x))

plt.show()

In [None]:
# Creamos la figura "fig" donde se le van agregar 3 subplots utilizando la variable "ax"

fig, ax = plt.subplots(nrows = 3, ncols = 2, figsize = (12, 12))

# Primera Columna
X = np.linspace(0, 10, 100)

ax[0, 0].plot(X, np.sin(X))   

ax[1, 0].plot(X, np.cos(X))

ax[2, 0].plot(X, np.tan(X))

# Segunda Columna
Y = np.linspace(-1, 1, 100)

ax[0, 1].plot(X, np.arcsin(Y))   

ax[1, 1].plot(X, np.arccos(Y))

ax[2, 1].plot(X, np.arctan(Y))

plt.show()

In [None]:
# Utilizamos un bucle for para llenar cada uno de los subplots de la figura 

x = np.linspace(-10, 10, 20)
y = x

fig, ax = plt.subplots(nrows = 2, ncols = 3, figsize = (14, 10))
k = 1

for rows in ax:  
    for ax1 in rows:
        ax1.plot(x, y**k, "blue")
        k += 1
        
plt.show()

## Personalizar plots

La libreria **`matplotlib`** tiene muchas formas de personalizar los plots, tanto usando los parámetros de la funciones o con otras funciones:

|Función| Descripción |
|-------|-------------|
|**`plt.figure(figsize = (alto, ancho))`**| Modifica el tamaño del plot.|
|**`plt.title()`**| Agrega un titulo al plot.|
|**`plt.xlabel()`**| Agrega una etiqueta al eje X.|
|**`plt.ylabel()`**| Agrega una etiqueta al eje Y.|
|**`plt.legend()`**| Si se pasaron etiquetas al plot, muestra la leyenda.|
|**`plt.xtick()`**| Modifica la vista de las marcas en el eje X.|
|**`plt.ytick()`**| Modifica la vista de las marcas en el eje Y.|
|**`plt.grid()`**| Agrega una malla o **"grid"** al plot.|

In [None]:
# Para añadir leyendas utilizamos legend()

X = np.linspace(-2, 2, 20)
Y = X ** 3
Z = X ** 2

plt.plot(X, Z, label = "Función cuadrada", color = "magenta")  
plt.plot(X, Y, label = "Función cubica", color = "green") 

plt.legend()
plt.title("Funciones", fontsize = 15)
plt.show()

In [None]:
# Voy a generar 2 listas aleatorias

X = np.random.random(100)
Y = np.random.random(100)

# Tamaño de la figura
plt.figure(figsize = (10, 8))

# Scatter
plt.scatter(X, Y)

# Estilos
plt.title("Scatter Plot.", fontsize = 20)
plt.xlabel("Eje X.", fontsize = 15)
plt.ylabel("Eje Y.", fontsize = 15)
plt.grid(True)

plt.show()

In [None]:
# 2 barplots en un solo plot

fig, ax = plt.subplots(figsize = (6, 6))

etiquetas = ["a", "b", "c", "d"]
valores1 = [10, 20, 30, 70]
valores2 = [20, 40, 50, 60]

x = np.arange(len(etiquetas))

ancho = 0.3

plt.bar(x - ancho/2, valores1, width = ancho, color = "blue")
plt.bar(x + ancho/2, valores2, width = ancho , color = "red")

ax.set_xticks(x)
ax.set_xticklabels(etiquetas)
plt.show()

In [None]:
# "Concatenar" barplots verticalmente

fig, ax = plt.subplots(figsize = (12, 8))

etiquetas=["a","b","c","d"]

valores1=[10, 20, 30, 40]
valores2=[20, 40, 50, 60]
valores3=[20, 40, 50, 60]
valores4=[100, 100, 100, 100]


x = np.arange(len(etiquetas)) 
ancho = 0.5

plt.bar(etiquetas, valores1, ancho, color = "blue")
plt.bar(etiquetas, valores2, ancho, color = "red",     bottom = valores1)
plt.bar(etiquetas, valores3, ancho, color = "green",   bottom = np.array(valores2) + np.array(valores1))
plt.bar(etiquetas, valores4, ancho, color = "magenta", bottom = np.array(valores3) + np.array(valores2) + np.array(valores1))

ax.set_xticks(x)
ax.set_xticklabels(etiquetas)
plt.show()

## Cambiar el tamaño por defecto de las figuras

In [None]:
# Para saber el tamaño de la figura por defecto 

plt.rcParams.get("figure.figsize")

In [None]:
# Para cambiar el tamaño determinado

fig_size = plt.rcParams["figure.figsize"] 

fig_size[0] = 8 #Ancho de la gráfica 
fig_size[1] = 6 #Altura de la gráfica

plt.rcParams["figure.figsize"] = fig_size  

In [None]:
# Revisamos el nuevo tamaño de figura

plt.rcParams.get("figure.figsize")

## 3D

In [None]:
# Grafica de la función de Schwefel

fig = plt.figure(figsize = (12, 8))
ax = fig.gca(projection = "3d")

# Valores del -100 al 100, con paso de 0.1
X = np.arange(-100, 100, 0.1)
Y = np.arange(-100, 100, 0.1)

X, Y = np.meshgrid(X, Y) # Creación de la malla 

# Ecuacion de Schwefel
Z = 418.9829 * 2 - (X*np.sin(np.sqrt(abs(X))) + Y*np.sin(np.sqrt(abs(Y))))

# Plot de la superficie
ax.plot_surface(X, Y, Z)

plt.show()

## plt.savefig()

**`plt.savefig()`** se usa para guardar la figura. Hay que llamar a esta función antes de **`plt.show()`**. Si lo hacemos después guardaremos una figura vacia.

In [None]:
# Para añadir leyendas utilizamos legend()

X = np.linspace(-2, 2, 20)
Y = X ** 3
Z = X ** 2

plt.plot(X, Z, label = "Función cuadrada", color = "magenta")  
plt.plot(X, Y, label = "Función cubica", color = "green") 

plt.legend()
plt.title("Funciones", fontsize = 15)

plt.savefig("figura_1.png")
plt.show()

## Graficos Estadísticos

In [None]:
# Vamos a utilizar las columnas del DataFrame de "iris.csv"

iris = pd.read_csv("iris.csv")

iris.head(3)

### Histogramas

**`plt.hist()`** muestra la frecuencia de los elementos de una lista.

In [None]:
plt.hist(iris["Largo Sepalo"])
plt.show()

### Personalisar los histogramas

In [None]:
plt.hist(iris["Largo Sepalo"], bins = 50, color = "green", alpha = 0.4)
plt.show()

In [None]:
plt.hist(iris["Largo Sepalo"], bins = 50, color = "green", alpha = 0.4, orientation = "horizontal")
plt.show()

In [None]:
# Varios histogramas en un mismo plot

plt.hist(iris.iloc[:50, 2],     bins = 20, alpha = 0.5, color = "magenta")

plt.hist(iris.iloc[50:100, 2],  bins = 20, alpha = 0.5, color = "Blue")

plt.hist(iris.iloc[100:150, 2], bins = 20, alpha = 0.5, color = "Red")

plt.show()

In [None]:
# Comparando con plt.plot()

plt.plot(iris.iloc[:50, 2],     alpha = 0.5, color = "magenta")

plt.plot(iris.iloc[50:100, 2],  alpha = 0.5, color = "Blue")

plt.plot(iris.iloc[100:150, 2], alpha = 0.5, color = "Red")

plt.show()

### Boxplot

**`plt.boxplot()`** para los boxplots necesitamos una lista de datos para cada categoria. Muestra un resumen de una gran cantidad de datos en cinco medidas descriptivas, además de intuir su morfología y simetría. Este tipo de gráficos nos permite identificar valores atípicos (outliers) y comparar distribuciones.

Los datos se dividen en cuatro partes iguales, separadas por puntos llamados cuartiles (quartiles).

- Rango (sin datos atípicos)
- Datos atípicos (outliers)
- Rango Intercuartil (también conocido como RIC)
- Cuartiles (Q1, Q2 y Q3)
- Mediana (Q2)
- Mínimo y Máximo

In [None]:
data = iris.iloc[:, :4]
etiquetas = iris.columns[:4]

plt.boxplot(x = data, labels = etiquetas)
plt.show()

### Violin plot

**`plt.violinplot()`** genera gráfica de violines. En resumen es un **`boxplot`** con **`histogramas`**.

In [None]:
data = iris.iloc[:, :4]
etiquetas = iris.columns[:4]

plt.violinplot(data, showmeans = True, showmedians = True, )
plt.show()

### Pie plot

**`plt.pie()`** genera un diagrama circular o grafico de pastel (pie). Para poder generarlo necesita una lista de datos y una lista de etiquetas.

In [None]:
tipo_gol = "Penalties", "Gol de campo", "tiro libre"
goles = [12, 38, 7]  
colores = ["magenta", "green", "red"]

plt.pie(goles, labels = tipo_gol, colors = colores, shadow = True, explode = (0.0, 0.0, 0.0))  
plt.show()  

In [None]:
tipo_gol = "Penalties", "Gol de campo", "tiro libre"
goles = [12, 38, 7]  
colores = ["magenta", "green", "red"]

plt.pie(goles, labels = tipo_gol, colors = colores, shadow = True, explode = (0.1, 0.1, 0.1), autopct = "%1.1f%%")  
plt.show()  

In [None]:
etiquetas = iris["Clase"].unique()
data = iris["Clase"].value_counts().values  
colores = ["magenta", "green", "red"]

plt.pie(data, labels = etiquetas, colors = colores, shadow = True, explode = (0.1, 0.1, 0.1), autopct = "%1.1f%%")
plt.title("Iris", fontsize = 20)
plt.show()  

In [None]:
################################################################################################################################