# **Visualización para análisis exporatorio**
# AE06. Seaborn Gráfico de Barras

Veamos más tipos de gráficos en Seaborn:


In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

In [None]:
sns.__version__ # Revisamos que estemos en la última versión de seaborn

In [None]:
# Importamos las librerias adicionales para el manejo numérico y de DataFrame
import numpy as np
import pandas as pd

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
penguins_df = pd.read_csv("/content/drive/MyDrive/VGroup/Viz/Archivos/VD02.csv").dropna()
penguins_df.head()

## <font color='blue'>__Gráficos de barras__</font>

Para generar gráficos de barras tenemos múltiples opciones utilizando seaborn, pero siempre con la misma lógica de llamar simplemente a un método y obtener el gráfico asociado. En este caso el primer método corresponde a `sns.barplot(x=X, y=Y, data=df, ci='sd)`, el cual nos generara un gráfico de barras asociados a las variables que nosotros asignemos. Una cosa a notar es el parámetro `ci` el cual hace mención a intervalo de confianza, y que nosotros le hemos dado el valor de `'sd'`. Este método realizara una agregación de forma automática al momento de graficar:

[Documentación Barplot](https://seaborn.pydata.org/generated/seaborn.barplot.html?highlight=barplot#seaborn.barplot)


In [None]:
sns.barplot(x='species', y ='bill_depth_mm', ci='sd',
            data=penguins_df)
plt.show()

**¿Qué será lo que está graficando?**

In [None]:
penguins_df.groupby("species")['bill_depth_mm'].agg(['mean','std'])

La respuesta es el promedio y la desviación estándar para dichas columnas. Nosotros podríamos cambiar el método de agregación utilizando el parámetro `agg` y asignándole como valor una función. Ejemplo de una modificación donde muestre el conteo de elementos no nulos y sin barras de "error":

In [None]:
# Dejamos el parametro ci=None para que evite calcular un intervalo de confianza
# y modificamos la función de agregación presente en el parametro `estimator`
sns.barplot(x='species', y ='bill_depth_mm', ci=None, estimator=pd.Series.count,
            data=penguins_df)
plt.show()

Alternativamente, existe un método genérico asociado a las variables categorías llamado: `sns.catplot`. Este método puede generar gráficos asociados a las variables categóricas de distinto tipo, utilizando el parámetro `kind` y para generar el primer gráfico de barra visto, simplemente declaramos `kind="bar"`:

In [None]:
sns.catplot(x="species", y="bill_depth_mm", kind="bar", data=penguins_df, ci='sd')
plt.show()

Además de `sns.barplot` y `sns.catplot`, tenemos el método `sns.countplot` el cual cuenta los elementos no nulos en las columna a graficar.

In [None]:
sns.countplot(x='species',data=penguins_df)
plt.show()

Y a su vez, existe el `kind=count` en el método `sns.catplot`

In [None]:
sns.catplot(x="species", kind="count", data=penguins_df)