### Subplots
Los subplots en matplotlib permiten mostrar varios gráficos en una sola figura. Esto es especialmente útil cuando se desea comparar diferentes conjuntos de datos o visualizar múltiples dimensiones de un mismo conjunto de datos de manera ordenada. Para crear subplots en matplotlib, se puede utilizar la función subplot() o el método subplots() del módulo pyplot.

In [None]:
import matplotlib.pyplot as plt
import numpy as np


plt.figure()

# La función subplot() toma tres argumentos:
    # nrows: Número de filas en la cuadrícula de subplots.
    # ncols: Número de columnas en la cuadrícula de subplots.
    # index: Índice del subplot actual (empezando desde 1).

# primer subplot
plt.subplot(1, 2, 1)
linear_data = np.array([1,2,3,4,5,6,7,8])
plt.plot(linear_data, '-o')

# segundo subplot
plt.subplot(1, 2, 2)
exponential_data = linear_data**2 
plt.plot(exponential_data, '-o')

In [None]:
# ax1 es una referencia al objeto Axes del subplot creado. Esta referencia se usa para personalizar
# y manipular este subplot más adelante
ax1 = plt.subplot(1, 2, 1)
plt.plot(linear_data, '-o')

# con ax2 = plt.subplot(122, sharey=ax1) se está creando el segundo subplot en la misma figura. 
# 122 es una forma compacta de escribir 1, 2, 2, que significa que habrá 1 fila, 2 columnas, y 
# este subplot será el segundo (derecha). sharey=ax1 indica que este subplot (ax2) compartirá 
# el eje y con ax1. Esto asegura que ambos subplots tengan la misma escala vertical.
ax2 = plt.subplot(122, sharey=ax1)
plt.plot(exponential_data, '-x')

Hay una función muy útil llamada subplots (nota el plural), que te permite obtener muchos objetos de ejes a la vez, y creo que esto es genial. Entonces, si quisiéramos obtener una cuadrícula de tres por tres con todos los rangos de ejes x e y bloqueados, podemos hacerlo así.

In [None]:
# creamos un grid de 3 x 3 desempaquetando una tupla
fig, ((ax1,ax2,ax3), (ax4,ax5,ax6), (ax7,ax8,ax9)) = plt.subplots(3, 3, sharex=True, sharey=True)

# dibujamos linear data en el 5º
ax5.plot(linear_data, '-')

#### SPLOM
Una técnica común de exploración visual en ciencia de datos se llama SPLOM, que significa matrices de diagramas de dispersión. Estos son particularmente útiles para obtener la relación entre varias variables de un vistazo rápido. Ahora, un SPLOM es en realidad similar a lo que Edward Tufte llamó un "múltiple pequeño": un conjunto de visuales que miran datos relacionados pero que dividen esos datos en diferentes visuales pequeños para que puedas ver tanto los árboles como el bosque a la vez.

In [None]:
# primero capturemos una lista de las variables en las que estamos interesados
import pandas as pd
df = pd.read_csv("../../assets/iris.csv")
cols = ['SepalLength', 'SepalWidth', 'PetalLength', 'PetalWidth']

In [None]:

# ahora necesitamos crear una cuadrícula de subplots de tamaño igual al número de diferentes variables
# que queremos explorar, en este caso es una cuadrícula de 4x4
fig, axs = plt.subplots(len(cols), len(cols), figsize=(10, 10))

# ahora queremos iterar a través de cada columna en nuestro dataframe y compararla con cada otra columna en nuestro
# DataFrame. Haremos esto con un par de bucles for anidados
for i in range(len(cols)):
    for j in range(len(cols)):

        # en cada iteración, se crea un diagrama de dispersión (scatter) comparando dos columnas (cols[j] y cols[i]).
        # vamos graficar un diagrama de dispersión comparando las columnas i y j. A veces será la
        # misma columna, así que esperaríamos ver una tendencia en línea diagonal.
        axs[i, j].scatter(df[cols[j]], df[cols[i]], s=5)

        # se desactivan las marcas y etiquetas de los ejes (get_xaxis().set_visible(False) y get_yaxis().set_visible(False)).
        axs[i, j].get_xaxis().set_visible(False)
        axs[i, j].get_yaxis().set_visible(False)

        # las etiquetas del eje x se activan solo para los subplots en la última fila.
        if i == len(cols) - 1:
            axs[i, j].get_xaxis().set_visible(True)
            axs[i, j].set_xlabel(cols[j])
            
        # las etiquetas del eje y se activan solo para los subplots en la primera columna. 
        if j == 0:
            axs[i, j].get_yaxis().set_visible(True)
            axs[i, j].set_ylabel(cols[i])

# mostramos el grafico
plt.show()