## Gráficos

En la clase de hoy haremos una introducción a la creación de gráficos con dos librerías: matplotlib y seaborn. La librería matplotlib está conformada por diversos módulos. De todos ellos nos interesa trabajar con pyplot, el cual contiene las funciones básicas para generar gráficos.

#### Matplotlib y Seaborn.

[Matplotlib](https://matplotlib.org/) es una de las principales librerías a la hora de graficar datos. Con esta se pueden realizar gráficos de barra, gráficos de línea, histogramas, gráficos de dispersión, mapas de calor, y otras visualizaciones. Incluso nos permite combinar diferentes tipos de visualización. Todo esto permitiendo editar los colores, fuentes, texto, etc.

Por su parte [Seaborn](https://seaborn.pydata.org/) es una libreria que une lo mejor de Matplotlib y Pandas, permitiendo crear, de forma muy sencilla gráficos de Matplotlib partiendo del uso de Data Frames de Pandas. Seaborn también tiene una [hoja de trucos](https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Seaborn_Cheat_Sheet.pdf) muy útil.



Vamos a realizar gráficos del dataset del Arbolado con el que venímos trabajando en las clases anteriores extraído de https://data.buenosaires.gob.ar/dataset/arbolado-publico-lineal. Recuerden que cada fila de este dataset representa UN Árbol

In [None]:
#importamos las librerias que utilizaremos
import pandas as pd
import matplotlib.pyplot as plt   # Solo importamos el módulo pyplot. se podría hacer "from matplotlib import pyplot as plt"
import seaborn as sns

In [None]:
data = pd.read_csv("https://cdn.buenosaires.gob.ar/datosabiertos/datasets/arbolado-publico-lineal/arbolado-publico-lineal-2017-2018.csv")
data.head()

#### Countplot

Ahora realizaremos un gráfico de barras que permite visualizar la cantidad de registros por determinada columna.
En este caso realizaremos un gráfico con la columna "comuna" para contar la cantidad de árboles por comuna (recuerden que cada fila es UN árbol).
[Ver documentación countplot](https://seaborn.pydata.org/generated/seaborn.countplot.html?highlight=countplot#seaborn.countplotde)

Primero realizaremos *value_counts()* para conocer los valores

In [None]:
data["comuna"].value_counts().sort_values(ascending=False)

In [None]:
sns.countplot(data["comuna"])

In [None]:
# para cambiar el eje x
sns.countplot(y=data["comuna"])

**¿Cuál es la comuna con más árboles?**

#### Barplot

Ahora realizaremos un barplot de la librería Seaborn.

Esto es un gráfico de barras que cruza dos datos, en este caso realizaremos un gráfico similar al anterior pero ahora veremos altura promedio de los arboles por comuna.

[Ver Documentación barplot](https://seaborn.pydata.org/generated/seaborn.barplot.html)


In [None]:
sns.barplot(data=data, x="comuna", y="altura_arbol")


**¿Cuál es la comuna con árboles más altos?**

#### Displot

Este gráfico sirve para ver distribuciones de variables numéricas, en este caso vamos a ver la altura de los arboles.

[Ver Documentación displot](https://seaborn.pydata.org/generated/seaborn.displot.html?highlight=displot#seaborn.displot)

In [None]:
sns.distplot(data["altura_arbol"])
#kind="kde"

**¿Qué altura tienen la mayor cantidad de árboles?**

#### Scatterplot

Otro gráfico que se puede realizr es Scatterplot que grafica puntos en dos ejes XY, en este caso cada punto será un arbol y gráficaremos *altura_arbol* y *diametro_altura_pecho* para ver si podemos ver una relación.

[Ver Documentación scatterplot](https://seaborn.pydata.org/generated/seaborn.scatterplot.html?highlight=scatterplot#seaborn.scatterplot)

In [None]:
sns.scatterplot(data=data, x="altura_arbol", y="diametro_altura_pecho")
