# Gráficas de Bigote

Ahora que ya saben cómo es que funcionan los Boxplots es momento de que lo hagan ustedes. En Python, la función para hacer este tipo de gráficos es `boxplot()`

Pero antes, al igual que con los histogramas, existe una función en numpy que nos puede ayudar a calcular los cuartiles y es `quantile()`



In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt


muestra = np.random.rand(50, 1)

quantiles = np.quantile(muestra, np.array([0.00, 0.25, 0.50, 0.75, 1.00]))

print(quantiles)

In [None]:
# Importar librerías
import numpy as np
import matplotlib.pyplot as plt

# Crear datos aleatorios
data = np.random.RandomState(9).randn(100) # consistencia, 0 es una distribución normal, 9 da outlayers

# Hacer el boxplot
fig, ax = plt.subplots()
plt.boxplot(data)
plt.title("Boxplot con Matplotlib")

Trabajaremos con varios grupos de datos y veamos qué tipo de personalización pueden hacer.

In [None]:
# Ahora qué pasa si quieren usar varios datos y compararlos

data2 =[np.random.RandomState(5).randn(100),
       2 * np.random.RandomState(1).randn(100) + 1,
       0.5 *np.random.RandomState(2).randn(100) - 1]


# Aqui también empieza la personalización de los plots
# Por ejemplo la orientación, colocar la línea media o quitar los outliers

fig, ax = plt.subplots()
plt.boxplot(data2, showmeans = True, meanline = True) #,vert = False , showfliers = False
plt.title("Boxplot con Matplotlib")

Para personalizar los colores, sí se puede pero hay que tener cuidado y también ver qué se puede cambiar.

In [None]:
data2 =[np.random.RandomState(5).randn(100),
       2 * np.random.RandomState(1).randn(100) + 1,
       0.5 *np.random.RandomState(2).randn(100) - 1]


# Para cambiar los colores es muy importante poner el patch_artist si no, nos va a salir un error

fig, ax = plt.subplots()
plt.boxplot(data2, showmeans = True, meanline = True, patch_artist= True, boxprops = dict(facecolor = '#37db6e')) # Color de las cajas
plt.title("Boxplot con Matplotlib")

In [None]:
# Color de la mediana
fig, ax = plt.subplots()
plt.boxplot(data2, showmeans = True, meanline = True, patch_artist= True, boxprops = dict(facecolor = '#37db6e'),
            medianprops = dict(color = "#ed3743", linewidth = 0.9))
plt.title("Boxplot con Matplotlib")

In [None]:
# Color de los bigotes

fig, ax = plt.subplots()
plt.boxplot(data2, showmeans = True, meanline = True, patch_artist= True, boxprops = dict(facecolor = '#37db6e'),
            medianprops = dict(color = "#ed3743", linewidth = 0.9),
            whiskerprops = dict(color = "red", linewidth = 2))
plt.title("Boxplot con Matplotlib")

In [None]:
# Color de la media

fig, ax = plt.subplots()
box_plot = plt.boxplot(data2, showmeans = True, meanline = True, patch_artist= True, boxprops = dict(facecolor = '#37db6e'),
            medianprops = dict(color = "#ed3743", linewidth = 0.9),
            whiskerprops = dict(color = "red", linewidth = 2),
            capprops = dict(color = "#163cc7", linewidth = 2.5),
            meanprops = dict(color = "#e5f53b", linewidth = 0.9))
plt.title("Boxplot con Matplotlib")

In [None]:
# Outliers

fig, ax = plt.subplots()
box_plot = plt.boxplot(data2, showmeans = True, meanline = True, patch_artist= True, boxprops = dict(facecolor = '#37db6e'),
            medianprops = dict(color = "#ed3743", linewidth = 0.9),
            whiskerprops = dict(color = "red", linewidth = 2),
            capprops = dict(color = "#163cc7", linewidth = 2.5),
            meanprops = dict(color = "#e5f53b", linewidth = 0.9),
            flierprops = dict(marker = 'o', markersize = 10, markerfacecolor = 'fuchsia'))
plt.title("Boxplot con Matplotlib")
plt.grid(True)

Muy bien, entonces es momento de trabajar con datos reales


In [None]:
# Vamos a trabajar con los datos de FIFA de nuevo

# Librerías
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

#._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._

# Cargar los datos
fifa = pd.read_csv('fifa_data.csv')
#._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._._

# Seleccionar los datos
barcelona = fifa.loc[fifa.Club == 'FC Barcelona']['Overall']
madrid = fifa.loc[fifa.Club == 'Real Madrid']['Overall']


In [None]:
# Hacer el boxplot como tal

fig, ax = plt.subplots()
box_plot = plt.boxplot([barcelona, madrid])
plt.title("Boxplot con Matplotlib")

# Qué podemos entender de estos datos

q_B = np.quantile(barcelona, np.array([0.0,0.25, 0.50, 0.75,1.0]))
q_M = np.quantile(madrid, np.array([ 0.0, 0.25, 0.50, 0.75, 1.0]))


print(f'Cuartiles de Barcelona {q_B}')
print(f'Cuartiles de Madrid {q_M}')

In [None]:
# Hay que pimpearlo

c = ['#e6c63c', '#64ed6d']
labels = ['Barcelona', 'Madrid']
fig, ax = plt.subplots()
box = box_plot = plt.boxplot([barcelona, madrid], showmeans = True, meanline = True, patch_artist= True,
                             meanprops = dict(color = "#37613a", linewidth = 0.9),
                             medianprops = dict(color = "#d91630", linewidth = 0.9),
                             labels = labels)
plt.title("Comparación de Clubs de Fútbol")
for patch, color in zip(box['boxes'], c):
    patch.set_facecolor(color)


print(fifa)

Su turno.
