# Matplotlib

Es una de las librerías de visualización en Python por excelencia. Se basa en trabajar las visualizaciones desde sucesión de funciones, es decir, vamos lanzando funciones desde su módulo `plot()` que visualizamos la gráfica con la función `show()`

+ Documentación de Matplotlib: https://matplotlib.org/
+ Tutorial de Matplotlib: https://matplotlib.org/stable/tutorials/index
+ Galería de visualizaciones: https://matplotlib.org/stable/gallery/index

## Creando nuestro primer gráfico

Lo primero que haremos será importar matplotlib, para trabajar con las funciones _plotting_ desde Python importaremos el módulo pyplot, generalmente Matplotlib, también se conoce con un alias __plt__

```python
import matplotlib.pyplot as plt
```

Una vez importado Matplotlib, para generar nuestra primera visualización, tomaremos dos listas, posteriormente, la función que se encarga de generar un gráfico es `plot()` por defecto, plot hasta que vayamos descubriendo otro tipo de visualizaciones genera un diagrama de líneas.

In [None]:
import matplotlib.pyplot as plt

In [None]:
# Datos
x = [1, 2, 3, 4, 5]
y = [2, 4, 12, 8, 10]

# Crear el gráfico de línea
plt.plot(x, y) # X es el eje horizontal X e Y, el eje vertical Y

# Mostrar el gráfico
plt.show()

¿Qué función tiene `show()`? - Prueba a dividir la visualización en dos celdas ¿Qué ocurre?

Una vez comprendido como lanzar nuestro primer gráfico de líneas podemos ir añadiendo más elementos, desde la filosofía de Matplotlib, es simplemente ir añadiendo más funciones, por ejemplo:
+ __`plt.xlabel`__ - Añade texto en el eje horizontal X
+ __`plt.ylabel`__ - Añade texto en el eje vertical Y
+ __`plt.title`__ - Añade el título de la visualización
+ __`plt.legend`__ - Añade una leyenda a la visualización (requiere que hayamos empleado el parámetro `label`en la función `plot`)

Así mismo, la función `plot` acepta varios parámetros como por ejemplo:
+ `linestyle` - Modifica el tipo de línea que estamos desplegando https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html
+ `marker` - Modifica sobre las líneas el tipo de marcador que se emplea https://matplotlib.org/stable/api/markers_api.html
+ `color` - Color de la línea https://matplotlib.org/stable/gallery/color/named_colors.html 
+ `label` - Añade texto en la visualización para desplegarlo en la leyenda.

Documentación de la función `plot`: https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html

In [None]:
# Personalizar etiquetas y título
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.title('Gráfico de Línea')

# Personalizar estilo de línea y marcadores
plt.plot(x, y, 
         linestyle = '--', 
         marker    = 'o', 
         color     = 'b', 
         label     = 'Línea de Ejemplo')

# Agregar leyenda
plt.legend()

# Mostrar el gráfico
plt.show()

También es posible añadir más de un vector a la visualización.

In [None]:
import numpy as np 

v1 = np.linspace(-2, 2, 200)
v2 = v1**2
v3 = v1**3

In [None]:
# Personalizar etiquetas y título
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.title('Gráfico de Línea')

# Personalizar estilo de línea y marcadores
plt.plot(v1, 
         linestyle = '-', 
         color     = 'red', 
         label     = 'Vector 1 (Original)')

plt.plot(v2, 
         linestyle = '--', 
         color     = 'brown', 
         label     = 'Vector 2 (Al cuadrado)')

plt.plot(v3, 
         linestyle = '-.', 
         color     = 'purple', 
         label     = 'Vector 3 (Al cubo)')

# Agregar leyenda
plt.legend()

# Mostrar el gráfico
plt.show()

## Múltiples visualizaciones

En Matplotlib se utiliza para crear subgráficos, es decir, dividir la ventana de representación en partes más pequeñas y colocar gráficos individuales en cada una de esas partes.

La sintaxis básica de subplot es la siguiente:
```python
plt.subplot(filas, columnas, índice)
```

En donde:
+ `filas`: El número de filas que tendrá la cuadrícula (parámetro fijo)
+ `columnas`: El número de columnas que tendrá la cuadrícula (parámetro fijo)
+ `índice`: El índice de cada subgráfico actual de la cuadrícula.

Por ejemplo, si tienes una cuadrícula de subgráficos con 2 filas y 2 columnas, puedes especificar cada subgráfico con índices del 1 al 4.

In [None]:
x = np.linspace(0, 2 * np.pi, 100)
y1 = np.sin(x)
y2 = np.cos(x)

In [None]:
# Crear subgráficos
plt.subplot(2, 1, 1)  # 2 filas, 1 columna, primer subgráfico
plt.plot(x, y1)
plt.title('Gráfico de Seno')

plt.subplot(2, 1, 2)  # 2 filas, 1 columna, segundo subgráfico
plt.plot(x, y2)
plt.title('Gráfico de Coseno')

# Ajustar diseño y mostrar gráficos
plt.tight_layout()
plt.show()

In [None]:
# Crear subgráficos
plt.subplot(2, 2, 1)  # 2 filas, 1 columna, primer subgráfico
plt.plot(v1, 
         linestyle = '-', 
         color     = 'red')
plt.title('Vector 1 (Original)')

plt.subplot(2, 2, 2)  # 2 filas, 1 columna, segundo subgráfico
plt.plot(v2, 
         linestyle = '--', 
         color     = 'brown')
plt.title('Vector 2 (Al cuadrado)')

plt.subplot(2, 2, 3)
plt.plot(v3, 
         linestyle = '-.', 
         color     = 'purple')
plt.title('Vector 3 (Al cubo)')

plt.subplot(2, 2, 4)
plt.plot(x, y1, 
         linestyle = ':', 
         color     = 'blue')
plt.title("Gráfico de Seno")

# Ajustar diseño y mostrar gráficos
plt.tight_layout() # Recomendable para no solapar títulos
                   #  y cualquier elemento de texto, es decir,
                   #  que no se solapen los gráficos
plt.show()

In [None]:
import pandas as pd

df = pd.read_csv("housing_California.csv")

In [None]:
plt.scatter(x = df.population, y = df.total_bedrooms)
plt.xlabel("Capacidad del hotel")
plt.ylabel("Total de dormitorios")
plt.title("Relación sobre la capacidad del hotel ~ total de dormitorios")
plt.show()

In [None]:
plt.bar(x = df.ocean_proximity, height=df.total_bedrooms)
plt.xlabel("Ubicación del hotel")
plt.ylabel("Total de dormitorios")
plt.title("Capacidad hotelera por ubicación")
plt.show()

# Seaborn

__Seaborn__ es una biblioteca de visualización de datos en Python basada en Matplotlib. Está diseñada para hacer que la creación de gráficos estadísticos atractivos y informativos sea más fácil. Seaborn proporciona una interfaz de alto nivel para crear visualizaciones estadísticas atractivas y, al mismo tiempo, aprovecha la flexibilidad de Matplotlib. 

En otras palabras... Seaborn permite crear múltiples visualizaciones desde una misma línea de código y es capaz de emplear sintaxis de Matplotlib

+ Documentación: https://seaborn.pydata.org/
+ Tutorial: https://seaborn.pydata.org/tutorial.html 
+ Galería: https://seaborn.pydata.org/examples/index.html

Seaborn, es otra de las librerías que tiene un alias, en este caso __sns__

```python
import seaborn as sns
```

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar un conjunto de datos de ejemplo
tips = sns.load_dataset("tips")
tips

In [None]:
# Crear un diagrama de dispersión con línea de regresión
sns.lmplot(x="total_bill", y="tip", data=tips, )

# Mostrar el gráfico
plt.show()

¿Y si quiero desactivar esa línea de regresión? - Explorar el parámetro `fit_reg`

In [None]:
# Cargar un conjunto de datos de ejemplo
tips = sns.load_dataset("tips")

# Crear un diagrama de dispersión con línea de regresión
sns.lmplot(x="total_bill", y="tip", data=tips, fit_reg=False)

# Mostrar el gráfico
plt.show()

Una de las grandes facilidades que tiene Seaborn, es el uso de variables categóricas como separadores, es decir, puede generar un punto, barra, línea, etc. A través del color de cada categoría. Esto se consigue desde el parámetro  `hue`

In [None]:
# Cargar un conjunto de datos de ejemplo
tips = sns.load_dataset("tips")

# Crear un diagrama de dispersión con línea de regresión
sns.lmplot(x       = "total_bill", 
           y       = "tip", 
           data    = tips, 
           fit_reg = False,
           hue     = "sex")

# Mostrar el gráfico
plt.show()

In [None]:
# Cargar un conjunto de datos de ejemplo
tips = sns.load_dataset("tips")

# Crear un diagrama de dispersión con línea de regresión
sns.lmplot(x       = "total_bill", 
           y       = "tip", 
           data    = tips, 
           fit_reg = True,
           hue     = "sex")

# Mostrar el gráfico
plt.show()

In [None]:
# Cargar un conjunto de datos de ejemplo
tips = sns.load_dataset("tips")

# Crear un diagrama de dispersión con línea de regresión
sns.lmplot(x       = "total_bill", 
           y       = "tip", 
           data    = tips, 
           fit_reg = False,
           hue     = "size")

# Mostrar el gráfico
plt.show()

In [None]:
# Otro ejemplo
sns.lmplot(x="total_bill", y="tip", hue="sex", 
           data=tips, markers=["o", "s"], 
           palette="Set1", # Paletas de colores https://seaborn.pydata.org/tutorial/color_palettes.html
           aspect=1.5 # Aumentamos el tamaño de la visualización
          )

plt.title('Diagrama de Dispersión con Ajustes Estilizados')
plt.show()

## Catplot

Para mostrar la distribución de una variable, en función de una serie de categorías, es posible emplear la función `catplot` para mostrar diseños tipo diagrama de caja y bigotes así como violin-plot

In [None]:
# Diagrama de caja y violín para comparar la distribución de propinas
sns.catplot(x="day", y="tip", data=tips, kind="boxen", palette="Set2")
plt.title('Distribución de Propinas por Día')
plt.show()

## Heatmap

Un tipo de visualización muy empleado, especialmente para mostrar la correlación lineal de las variables numéricas de un conjunto de datos. A través de la función `heatmap`

In [None]:
sns.heatmap(tips.corr(numeric_only=True), annot=True, cmap="coolwarm")
plt.title('Matriz de Correlación')
plt.show()

## Diagrama de barras

In [None]:
sns.barplot(x="day", y="total_bill", hue="time", 
            data=tips)

plt.title('Total de Factura por Día y Hora')
plt.show()

## Diagrama de pares

Los llamados `pairplot` o diagramas de pares son muy útiles para tener un primer vistazo del cojunto de datos, generan una cuadrícula de visualización de todas las variables numéricas contra todas las variables numéricas, como siempre, en Seaborn, a través del parámetro `hue` es posible desagregar toda la visualización a través de una variable categórica.

In [None]:
sns.pairplot(tips, hue="sex", palette="husl")
plt.suptitle('Diagrama de Pares', y=1.02)
plt.show()

# Anexo Plotly - Plotly Express

__Plotly Express__ es un tipo de librería de visualización que se caracteriza principalmente por realizar visualizaciones de tipo dinámico, es decir, son interactivas, al pasar el mouse por encima de la visualización, esta nos devolverá información de forma dinámica (esta información se conoce como _tooltips_) 

Plotly, no lo tenemos instalado por defecto desde una distribución de Anaconda, debemos instalarlo de la siguiente manera:

```python
!pip install plotly
```

Plotly es posible emplearlo desde su versión general (Plotly) o, desde funciones de alto nivel (Plotly Express)

+ Documentación: https://plotly.com/graphing-libraries/ 
+ Tutorial: https://plotly.com/python/plotly-fundamentals/
+ Galería: https://plotly.com/python/

Para trabajar con la versión express, debemos importarla desde el alias __px__

```python
import plotly.express as px
```

### Primera visualización - Nube de puntos

In [None]:
import plotly.express as px

In [None]:
# Definimos una lista para generar un diagrama de líneas
x = [200, 250, 225, 300, 330, 400, 270, 260,]
y = [10, 20, 30, 22, 44, 25, 9, 31]

In [None]:
px.scatter(x = x, y = y, title="Ejemplo visualización")

In [None]:
# Otro ejemplo, cargamos de nuevo tips
tips = sns.load_dataset("tips")

# Crear un gráfico de dispersión interactivo con Plotly Express
fig = px.scatter(tips, x="total_bill", y="tip", 
                 color = "sex",
                 size  = "size", 
                 title = "Monto total de propinas en función del sexo")
fig.show()


### Entendiendo los Graph Objects

Los __Graph Objects__ de son clases de bajo nivel que permiten un mayor control y personalización sobre los gráficos que se crean con Plotly, para definir la visualización tendremos que configurar los siguientes espacios gráficos:
+ Figure: Inicializar visualización
+ Layout: Estilos de la visualización como título, etiquetas, etc.
+ Trace: Tipo específico de visualización

https://plotly.com/python/graph-objects/

In [None]:
import pandas as pd
import numpy as np

In [None]:
data = {
    "Ingresos" : np.sort(np.random.randint(10, 170, 100)),
    "Gastos"   : np.sort(np.random.randint(20, 150, 100)),
    "Ventas Netas"   : np.sort(np.random.randint(30, 150, 100)),
    "Ventas Brutas"  : np.sort(np.random.randint(20, 170, 100))
}

df = pd.DataFrame(data)

In [None]:
import plotly.graph_objects as go

# Figure: Inicializar visualización
# Layout: Estilos de la visualización como título, etiquetas, etc.
# Trace: Tipo específico de visualización

In [None]:
# Creamos Trace
trace_0 = go.Scatter(x = df["Ingresos"], y = df["Gastos"])
trace_1 = go.Scatter(x = df["Ventas Brutas"], y = df["Ventas Netas"])

# Creamos Layout
layout = go.Layout(title="Análisis Financiero",
                  xaxis = dict(title = "Finanzas 1"),
                  yaxis = dict(title = "Finanzas 2"))

# Creamos la Figure
fig = go.Figure(
    data   = [trace_0, trace_1], 
    layout = layout)

fig.show()

Otro ejemplo con datos bursátiles de Facebook

In [None]:
fb = pd.read_csv("FB.csv")
fb.head()

In [None]:
# Creamos Trace
trace_0 = go.Scatter(x = fb.Date, y = fb.Close, name = "Precio de Cierre")
trace_1 = go.Scatter(x = fb.Date, y = fb.Open, name = "Precio de Apretura")
trace_2 = go.Scatter(x = fb.Date, y = fb.High, name = "Precio de más alto")
trace_3 = go.Scatter(x = fb.Date, y = fb.Low, name = "Precio de más bajo")

# Creamos Layout
layout = go.Layout(title="Precios de apertura y cierre de Facebook",
                  xaxis = dict(title = "Serie temporal"),
                  yaxis = dict(title = "Precio apertura - cierre"))

# Creamos la Figure
fig = go.Figure(
    data   = [trace_0, trace_1, trace_2, trace_3], 
    layout = layout)

fig.show()

## Tipo geográfico

Para mostrar un tipo de gráfico geográfico, vamos a utilizar el conjunto de datos "gapminder", que contiene información sobre indicadores económicos, demográficos y de salud para varios países a lo largo del tiempo. 

Vamos a crear un gráfico de dispersión geográfico para visualizar la relación entre la expectativa de vida y el PIB per cápita para diferentes países.

Para crear crear un mapa de tipo geográfico con Plotly es necesario utilizar la función `scatter_geo` que se encargará de inicializar un tipo de mapa según el parámetro `projection` pero, es necesario que en el parámetro `locations` pasemos información válida de tipo geográfico como coordenadas, o códigos ISO de países.

https://plotly.com/python-api-reference/generated/plotly.express.scatter_geo


In [None]:
# Cargamos el cojunto de datos de Gapminder
gapminder = px.data.gapminder()
gapminder.head()

In [None]:
# Mapa de tipo geográfico
fig = px.scatter_geo(gapminder,                # Cojunto de datos
                     locations  = "iso_alpha", # Códigos ISO-3 de los países
                     size       = "pop",       # Tamaño de los puntos según la población
                     hover_name = "country",   # Etiqueta que aparecerá al pasar el ratón (tooltips)
                     animation_frame = "year", # Animación a lo largo del tiempo
                     projection = "natural earth",  # Proyección del mapa
                     title      = "Relación entre Expectativa de Vida, PIB per Cápita y Población por País")

fig.show()

## Plotly Dash

Pese a la sensillez y popularidad de herramientas como PowerBI o Tableau para realizar cuadros de mando, desde Python, con Plotly Dash es posible también crear cuadros de mando controlando todo el código fuente, existe una versión Open Source, así como Enterprise.

https://plotly.com/examples/