## Gráficos

En la clase de hoy haremos una introducción a la creación de gráficos con dos librerías: matplotlib y seaborn. La librería matplotlib está conformada por diversos módulos. De todos ellos nos interesa trabajar con pyplot, el cual contiene las funciones básicas para generar gráficos. 

#### Matplotlib y Seaborn.
 
[Matplotlib](https://matplotlib.org/) es una de las principales librerías a la hora de graficar datos. Con esta se pueden realizar gráficos de barra, gráficos de línea, histogramas, gráficos de dispersión, mapas de calor, y otras visualizaciones. Incluso nos permite combinar diferentes tipos de visualización. Todo esto permitiendo editar los colores, fuentes, texto, etc. 
 
Por su parte [Seaborn](https://seaborn.pydata.org/) es una libreria que une lo mejor de Matplotlib y Pandas, permitiendo crear, de forma muy sencilla gráficos de Matplotlib partiendo del uso de Data Frames de Pandas. Seaborn también tiene una [hoja de trucos](https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Seaborn_Cheat_Sheet.pdf) muy útil. 
 


In [1]:
#importamos las librerias que utilizaremos
import pandas as pd
import matplotlib.pyplot as plt   # Solo importamos el módulo pyplot. se podría hacer "from matplotlib import pyplot as plt"
import seaborn as sns

La librería Seaborn permite cargar Dataset incluídos en ella. En este caso utilizaremos un dataset de exoplanetas que se han descubierto hasta 2014 extraído de https://exoplanets.nasa.gov/discovery/exoplanet-catalog/

In [12]:
data_planets = sns.load_dataset('planets')
data_planets.head()

URLError: <urlopen error [WinError 10060] Se produjo un error durante el intento de conexión ya que la parte conectada no respondió adecuadamente tras un periodo de tiempo, o bien se produjo un error en la conexión establecida ya que el host conectado no ha podido responder>

In [None]:
print(data_planets.shape)


#### Countplot

Ahora realizaremos un gráfico de barras que permite visualizar la cantidad de registros por determinada columna.  
En este caso realizaremos un gráfico de la cantidad de planetas por cada método de descubrimiento.
[Ver documentación countplot](https://seaborn.pydata.org/generated/seaborn.countplot.html?highlight=countplot#seaborn.countplotde)

Primero realizaremos *value_counts()* para conocer los valores

In [None]:
data_planets["method"].value_counts()

In [None]:
sns.countplot(data_planets["method"])

In [None]:
# para cambiar el eje x y que se vea correctamente

sns.countplot(y=data_planets["method"])

#### Barplot

Ahora realizaremos un barplot de la librería Seaborn. 

Esto es un gráfico de barras con la cantidad de cada tipo, realizaremos un gráfico similar al anterior pero de la cantidad de planetas descubiertos en cada año. Para esto primero realizaremos una agrupación por año y la utilizaremos esta agrupación para realizar el gráfico.

[Ver Documentación barplot](https://seaborn.pydata.org/generated/seaborn.barplot.html)


In [None]:
# Realizamos la agrupación a través de la columna "encuentro_anio"

data_agrupada = data_planets.groupby("year")

In [None]:
# Generamos el dato de la cantidad de encuentros sobre la agrupación (se cuenta year pero podria ser sobre cualquiera)

data_para_grafico = data_agrupada["year"].count()
data_para_grafico

In [None]:
sns.barplot(x=data_para_grafico.index, y=data_para_grafico)    #Index es el índice, en este caso el año de descubrimiento


In [None]:
# Cambiaremos la rotación de la etiquetas del eje X con plt.xticks

sns.barplot(x=data_para_grafico.index, y=data_para_grafico)    #Index es el índice, en este caso el año de descubrimiento
plt.xticks(rotation=45)


#### Displot

Este gráfico sirve para ver distribuciones de variables numéricas, en este caso vamos a ver la masa de los exoplanetas.

[Ver Documentación displot](https://seaborn.pydata.org/generated/seaborn.displot.html?highlight=displot#seaborn.displot)

In [None]:
sns.displot(data=data_planets, x="mass", kind="kde")


#### Scatterplot

Otro gráfico que se puede realizr es Scatterplot que grafica puntos en dos ejes XY, en este caso cada punto será un planeta y gráficaremos *mass* y *distance* para ver si podemos ver una relación.

[Ver Documentación scatterplot](https://seaborn.pydata.org/generated/seaborn.scatterplot.html?highlight=scatterplot#seaborn.scatterplot)

In [None]:
sns.scatterplot(data=data_planets, x="distance", y="mass")
