# IMEC2001 Herramientas Computacionales 
## Semana 2: Datos y Visualizaciones
### Clase 4: `matplotlib`

Universidad de los Andes — Abril 14, 2023.

---

## TABLA DE CONTENIDO

### Sección 1: Visualizaciones con `matplotlib` [→](#section1)
- 1.1. Cargar Librerías
- 1.2. Primeros Pasos: `plot` y `scatter`
- 1.3. Colores, Marcadores y Estilos
- 1.4. Ejes y Leyenda
- 1.5. Otras Adiciones
- 1.6. Gráfica de Barras  
- 1.7. Gráfica log-log
- 1.8. Histogramas
___

<a id="section1"></a>
# Sección 1: Visualizaciones con `matplotlib`

In [None]:
!pip install matplotlib

## 1.1. Cargar Librerías

Primero, asegurémonos de haber instalado la librería:

> ```python
  pip install matplotlib
  ```

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

Notemos que `as plt` es un *alias* con la que nos referiremos a la librería `matplotlib`. Este *alias* puede ser cualquiera, pero por convención utilizaremos `as plt`.

## 1.2. Primeros Pasos: `plot` y `scatter`

In [None]:
import numpy as np

In [None]:
x = np.linspace(0, 2*np.pi, 50) # start, finish, number of points
x

In [None]:
y = np.sin(x)
y

In [None]:
plt.plot(x, y)

In [None]:
z = np.cos(x)
z

In [None]:
plt.scatter(x, z)

Fijémonos en que ambas gráficas tienen la misma sintaxis: `plt.<gráfica>(<eje x>, <eje y>)`. Si la gráfica es:

- `plt.plot`, obtenemos una línea contínua.
- `plt.scatter`, obtenemos puntos (i.e., no contínuo).

Ahora bien, si tenemos las dos gráficas en una misma celda, Jupyter Notebook interpreta que estas van juntas en un mismo recuadro.

In [None]:
plt.plot(x, y)
plt.scatter(x, z)

Para separarlas, debemos indicar que se tienen **figuras** diferentes con el código `plt.figure()`. Notemos que en una misma celda (esto en Jupyter Notebook), me despliega las dos gráficas por separado.

In [None]:
# Gráfica 1
plt.figure()
plt.plot(x, y)

# Gráfica 2
plt.figure()
plt.scatter(x, z)

**Nota:** Con `plt.figure()` también podemos establecer el tamaño de la gráfica.

In [None]:
# Gráfica 1
hor = 10
ver = 4

plt.figure(figsize=(hor,ver)) # Tamaño

plt.plot(x, y)

# Gráfica 2
hor = 3
ver = 6

plt.figure(figsize=(hor,ver)) # Tamaño

plt.scatter(x, z)

## 1.3. Colores, Marcadores y Estilos

Tomemos las dos gráficas anteriores en un mismo recuadro. ¿Qué opinan?

In [None]:
plt.plot(x, y)
plt.scatter(x, z)

Para mejorar la visualización, podemos empezar modificando el **color** de las gráficas con el parámetro `color`.

<div class='alert alert-block alert-info'>   
    
<i class='fa fa-info-circle' aria-hidden='true'></i>
Puede obtener más información en la documentación oficial de la librería `matplotlib` dando clic [aquí](https://matplotlib.org/stable/gallery/color/named_colors.html).
</div>

In [None]:
plt.plot(x, y, color='darkorange')
plt.scatter(x, z, color='teal')

También podemos modificar el estilo de línea (para `plt.plot`).

<div class='alert alert-block alert-info'>   
    
<i class='fa fa-info-circle' aria-hidden='true'></i>
Puede obtener más información en la documentación oficial de la librería `matplotlib` dando clic [aquí](https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html).
</div>

Al igual que podemos modificar los marcadores (para `plt.scatter`).

<div class='alert alert-block alert-info'>   
    
<i class='fa fa-info-circle' aria-hidden='true'></i>
Puede obtener más información en la documentación oficial de la librería `matplotlib` dando clic [aquí](https://matplotlib.org/stable/api/markers_api.html).
</div>

In [None]:
plt.plot(x, y, color='darkorange', linestyle='dashed', linewidth=5) # Note el parámetro linewidth
plt.scatter(x, z, color='teal', marker='^')

**Nota:** Las posibilidades de `plt.scatter` la tenemos desde `plt.plot`, por ejemplo:

In [None]:
plt.plot(x, z, color='teal', linestyle='', marker='^') # Note el parámetro linestyle=''

También con `plt.plot` podemos unir líneas continuas con marcadores, así:

In [None]:
plt.plot(x, y, color='darkorange', linestyle='dashed', linewidth=2, marker='o') # Note el parámetro linewidth

## 1.4. Ejes y Leyenda

Empecemos definiendo el título de la gráfica y de los ejes. Para esto, utilizamos las funciones:

- `plt.title()`
- `plt.ylabel()`
- `plt.xlabel()`

In [None]:
hor = 8
ver = 5
plt.figure(figsize=(hor, ver))

plt.plot(x, y, color='darkorange', linestyle='dashed', linewidth=5)
plt.plot(x, z, color='teal', linestyle='', marker='^')

plt.title('Comportamiento Curvas', fontsize=15) # Título
plt.ylabel('Magnitud [ad.]', fontsize=13) # Etiqueta eje vertical
plt.xlabel('Ángulo [º]', fontsize=13) # Etiqueta eje horizontal

Ahora, agreguemos una etiqueta y leyenda para las curvas. Esto es agregando el parámetro `label` en `plt.plot`.

In [None]:
hor = 8
ver = 5
plt.figure(figsize=(hor, ver))

plt.plot(x, y, color='darkorange', linestyle='dashed', linewidth=5, label='sin(x)') # Note el parámetro label
plt.plot(x, z, color='teal', linestyle='', marker='^', label='cos(x)') # Note el parámetro label

plt.title('Comportamiento Curvas', fontsize=15)
plt.ylabel('Magnitud [ad.]', fontsize=13)
plt.xlabel('Ángulo [º]', fontsize=13)
plt.legend(loc='best', fontsize=11) # Note el parámetro 'loc'

## 1.5. Otras Adiciones

¿Qué hay de nuevo entre esta y la celda anterior?

<div class='alert alert-block alert-info'>   
    
<i class='fa fa-info-circle' aria-hidden='true'></i>
Puede obtener más información en la documentación oficial de la librería `matplotlib` dando clic [aquí](https://matplotlib.org/stable/tutorials/index.html).
</div>

In [None]:
hor = 8
ver = 5
plt.figure(figsize=(hor, ver))

plt.plot(x, y, color='darkorange', linestyle='dashed', linewidth=5, label='sin(x)')
plt.plot(x, z, color='teal', linestyle='', marker='^', label='cos(x)')

plt.rcParams['axes.axisbelow'] = True

plt.title('Comportamiento Curvas', fontsize=15)
plt.ylabel('Magnitud [ad.]', fontsize=13)
plt.xlabel('Ángulo [º]', fontsize=13)

plt.tick_params(direction='out', length=5, width=0.75, grid_alpha=0.3)
plt.xticks(rotation=0)
plt.minorticks_on()
plt.ylim(None, None)
plt.xlim(None, None)
plt.grid(True)
plt.grid(visible=True, which='major', color='grey', linestyle='-')
plt.grid(visible=True, which='minor', color='lightgrey', linestyle='-', alpha=0.2)
plt.legend(loc='best', fontsize=11)
plt.tight_layout;
plt.savefig('./plot.png', dpi=400, bbox_inches='tight') # Descargar la gráfica (se sugiere .png, .pdf o .eps)

## 1.6. Gráfica de Barras

<div class='alert alert-block alert-info'>   
    
<i class='fa fa-info-circle' aria-hidden='true'></i>
Puede obtener más información en la documentación oficial de la librería `matplotlib.pyplot.bar` dando clic [aquí](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html).
</div>

In [None]:
import pandas as pd

file_name = './data/engines.xlsx' # ./ es pwd()
sheet = 'Data'

df = pd.read_excel(io=file_name, sheet_name=sheet)

df.head()

Para realizar una visualización de barras, utilizamos la función `plt.bar`. A diferencia de `plt.plot` y `plt.scatter`, `plt.bar` solo toma **un único** argumento de entrada.

In [None]:
x = df['Engine']
y = df['Maximum Brake Horsepower (BHP)']

plt.bar(x, y)

Para retorcarla, utilizamos las mismas funciones que revisamos antes.

In [None]:
hor = 10
ver = 4
plt.figure(figsize=(hor, ver))

plt.bar(x, y, color='tan', label='Caballos de Potencia')

plt.rcParams['axes.axisbelow'] = True

plt.title('Comportamiento', fontsize=15)
plt.ylabel('Potencia [hp]', fontsize=13)
plt.xlabel('Motor', fontsize=13)

plt.tick_params(direction='out', length=5, width=0.75, grid_alpha=0.3)
plt.xticks(rotation=90)
plt.ylim(None, None)
plt.xlim(None, None)
plt.grid(True)
plt.legend(loc='best', bbox_to_anchor=(1,1), fontsize=11)
plt.tight_layout;
plt.savefig('./bar_ver.png', dpi=400, bbox_inches='tight')

In [None]:
hor = 4
ver = 10
plt.figure(figsize=(hor, ver))

plt.barh(x, y, color='tan', label='Caballos de Potencia') # Aquí utilizamos plt.barh en lugar de plt.bar

plt.rcParams['axes.axisbelow'] = True

plt.title('Comportamiento', fontsize=15)
plt.ylabel('Potencia [hp]', fontsize=13)
plt.xlabel('Motor', fontsize=13)

plt.tick_params(direction='out', length=5, width=0.75, grid_alpha=0.3)
plt.xticks(rotation=90)
plt.ylim(None, None)
plt.xlim(None, None)
plt.grid(True)
plt.legend(loc='best', fontsize=11)
plt.tight_layout;
plt.savefig('./bar_hor.png', dpi=400, bbox_inches='tight')

## 1.7. Gráfica log-log

<div class='alert alert-block alert-info'>   
    
<i class='fa fa-info-circle' aria-hidden='true'></i>
Puede obtener más información en la documentación oficial de la librería `matplotlib.pyplot.loglog` dando clic [aquí](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.loglog.html).
</div>

In [None]:
x = df['Mass (Kg)'].to_list()
y = df['Maximum Brake Horsepower (BHP)'].to_list()

hor = 7
ver = 5
plt.figure(figsize=(hor, ver))

plt.loglog(x, y, color='#1580E4', linewidth=0.5, zorder = 10, linestyle='--', marker='o') # Color con formato HEX

plt.rcParams['axes.axisbelow'] = True

plt.title('Relación log(BHP) vs. log(Masa)', fontsize=15);
plt.ylabel('Potencia, $BHP$', fontsize=13);
plt.xlabel('Masa, $Kg$', fontsize=13);

plt.tick_params(direction='out', length=5, width=0.75, grid_alpha=0.3)
plt.xticks(rotation=0)
plt.ylim(None, None)
plt.xlim(None, None)
plt.grid(True)
plt.grid(b=True, which='minor', color='grey', linestyle='--', alpha=0.2)
plt.yscale('log') # Note la función plt.yscale
plt.tight_layout;
plt.savefig('./loglog.png', dpi=400, bbox_inches='tight')

## 1.8. Histogramas

<div class='alert alert-block alert-info'>   
    
<i class='fa fa-info-circle' aria-hidden='true'></i>
Puede obtener más información en la documentación oficial de la librería `matplotlib.pyplot.hist` dando clic [aquí](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html).
</div>

In [None]:
mu = 1 # Promedio
sigma = 0.5 # Desviación
n = 1000 # Número datos

data = np.random.normal(mu, sigma, n)
type(data)

In [None]:
plt.hist(data, bins=20);

In [None]:
x = df['Mass (Kg)']
y = df['Maximum Brake Horsepower (BHP)']

hor = 7
ver = 5
plt.figure(figsize=(hor, ver))

plt.hist(data, bins=20, color='lightgrey', alpha=1) # Note el parámetro bins

plt.rcParams['axes.axisbelow'] = True

plt.title('Histograma', fontsize=15);
plt.ylabel('Frecuencia', fontsize=13);
plt.xlabel('Magnitud', fontsize=13);

plt.tick_params(direction='out', length=5, width=0.75, grid_alpha=0.3)
plt.xticks(rotation=0)
plt.ylim(None, None)
plt.xlim(None, None)
plt.grid(True)
plt.tight_layout;

In [None]:
x = df['Mass (Kg)']
y = df['Maximum Brake Horsepower (BHP)']

hor = 7
ver = 5
plt.figure(figsize=(hor, ver))

plt.hist(data, bins=20, color='lightgrey', alpha=1) # Note el parámetro bins

plt.axvline(x=mu, color='red', linestyle='--', linewidth=0.75, label=f'Promedio: {mu}') # Promedio
plt.axvline(x=mu+sigma, color='dodgerblue', linestyle='--', linewidth=0.75, label=f'$\mu + \sigma$: {mu+sigma}') # +Desviación
plt.axvline(x=mu-sigma, color='dodgerblue', linestyle='--', linewidth=0.75, label=f'$\mu - \sigma$: {mu-sigma}') # -Desviación

plt.rcParams['axes.axisbelow'] = True

plt.title('Histograma', fontsize=15);
plt.ylabel('Frecuencia', fontsize=13);
plt.xlabel('Magnitud', fontsize=13);

plt.tick_params(direction='out', length=5, width=0.75, grid_alpha=0.3)
plt.xticks(rotation=0)
plt.ylim(None, None)
plt.xlim(None, None)
plt.grid(True)
plt.legend(loc='best', fontsize=11)
plt.tight_layout;
plt.savefig('./hist.png', dpi=400, bbox_inches='tight')