# Gráficos

Una parte fundamental del análisis de datos es la exploración y visualización de los mismos, lo cual se suele llevar a cabo a través de gráficos.

[Matplotlib](https://matplotlib.org/) es una librería que nos permite generar gráficos a partir de nuestros datos de manera rápida y con calidad de publicación.

## Importando matplotlib

Una de las formas más sencillas de hacer uso de esta librería es a través del módulo `pyplot`, al cual lo solemos importar bajo el alias `plt`.



In [None]:
import numpy as np
import matplotlib.pyplot as plt

## Graficando funciones

Muchas veces deseamos visualizar gráficamente una función matemática que depende de cierta variable.
Por ejemplo, grafiquemos la función seno entre 0 y 2$\pi$.

In [None]:
x = np.linspace(0, 2 * np.pi, 100)
print(x)

In [None]:
y = np.sin(x)

In [None]:
plt.plot(x, y)
plt.show()

## Múltiples curvas en un mismo gráfico

¿Cómo podemos incluir varias curvas en un mismo gráfico?

In [None]:
print(x)

In [None]:
plt.plot(x, np.sin(x))
plt.plot(x, np.sin(2 * x))
plt.plot(x, np.sin(3 * x))

plt.show()

Podemos modificar el estilo de las líneas, para que puedan ser identificadas no solo con colores, sino tambien por la geometría de sus líneas.

In [None]:
plt.plot(x, np.sin(x), linestyle="-")
plt.plot(x, np.sin(2 * x), linestyle="--")
plt.plot(x, np.sin(3 * x), linestyle="-.")
plt.show()

### Buenas prácticas

A la hora de visualizar datos y publicarlos, siempre tenemos que asegurarnos de que nuestras figuras cuenten con:

- Anotaciones de los ejes coordenados
- Unidades de los ejes
- Leyenda (si tenemos varios plots en la misma figura)

Además, podemos añadir información y algunos detalles como:

- Un título
- Decoraciones como un grid

In [None]:
plt.plot(x, np.sin(x), linestyle="-", label="sin(x)")
plt.plot(x, np.sin(2 * x), linestyle="--", label="sin(2x)")
plt.plot(x, np.sin(3 * x), linestyle="-.", label="sin(3x)")
plt.legend()
plt.xlabel("x")
plt.ylabel("y")
plt.grid()
plt.show()

## Graficando datos

Recolectemos datos de temperaturas medias anual de toda el planeta, desde 1850 hasta la actualidad, puestos a disponibilidad por [Berkeley Earth](http://berkeleyearth.org/).
Los archivos de datos pueden ser descargados desde su página web, pero en el repositorio ya contamos con una versión simplificada de uno de ellos en `data/temperature-berkeley.dat`.

Vamos a importar la clase `Path` de `pathlib` que nos sirve para crear rutas a archivos y carpetas de nuestro disco.
Definamos la ruta al archivo de temperaturas. Al utilizar `Path` para esto, nos aseguramos que este código pueda funcionar en diversos sistemas operativos, sin importar qué tipo de separador de directorios utilizan (`/` o `\`) entre otras diferencias.
Recordemos que el símbolo `..` hace referencia al directorio padre del cual en el que estamos paradxs.
Dado que el directorio `data` se encuentra al mismo nivel que `notebooks`, debemos "subir" un nivel para poder acceder a él.

In [None]:
from pathlib import Path

In [None]:
berkeley_data_file = Path("..") / "data" / "temperature-berkeley.dat"
berkeley_data_file

Usemos la función `numpy.loadtxt` para leer el archivo.

In [None]:
datos = np.loadtxt(berkeley_data_file)
datos

Podemos extraer las columnas correspondiente años y temperaturas del array `datos`

In [None]:
years, temperaturas = datos[:, 0], datos[:, 1]

Grafiquemos estos valores:

In [None]:
plt.plot(years, temperaturas)
plt.show()

Matplotlib nos permite modificar los marcadores del gráfico

In [None]:
plt.plot(years, temperaturas, "o")
plt.xlabel("Años")
plt.ylabel("Temperatura [C]")
plt.title("Temperatura media anual de la Tierra")
plt.grid()
plt.show()

Matplotlib nos permite guardar la gráfica como una imagen png:

In [None]:
plt.plot(years, temperaturas, "o")
plt.xlabel("Años")
plt.ylabel("Temperatura [C]")
plt.title("Temperatura media anual de la Tierra")
plt.grid()
plt.savefig("temperatura.png", dpi=300)
plt.show()

O bien como PDF (imagen vectorial):

In [None]:
plt.plot(years, temperaturas, "o")
plt.xlabel("Años")
plt.ylabel("Temperatura [C]")
plt.title("Temperatura media anual de la Tierra")
plt.grid()
plt.savefig("temperatura.pdf")
plt.show()

## Otros tipos de gráficos

Matplotlib nos permite realizar múltiples tipos de gráficos.

**Scatter**

En caso de que nuestros datos se encuentren dispersos

In [None]:
plt.scatter(years, temperaturas)
plt.show()

**Histograma**

In [None]:
plt.hist(temperaturas)
plt.xlabel("Temperaturas [C]")
plt.ylabel("Frecuencia")
plt.show()

## Customizando nuestros gráficos

Matplotlib nos permite modificar aspectos visuales de nuestros gráficos.

In [None]:
plt.scatter(years, temperaturas, color="red")
plt.xlabel("Años")
plt.ylabel("Temperatura [C]")
plt.title("Temperatura media anual de la Tierra")
plt.show()

Aunque es recomendable utilizar los colores predefinidos en la paleta de colores que trae matplotlib, la cual es amigable con determinadas deficiencias visuales (color blindness) y los diferentes colores pueden ser apreciados incluso en impresiones en blanco y negro. Podemos acceder a estos colores a través de los strings `C0`, `C1`, `C2`, ..., `C9`.

In [None]:
colores = ["C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9"]
for color in colores:
    plt.scatter(years, temperaturas, color=color)
    plt.show()

## Ejercicio 1:

La función gaussiana centrada en cero puede ser escrita como:

$$ g(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{1}{2}\left(\frac{x}{\sigma}\right)^2 }. $$

Analicemos gráficamente cómo diferentes valores de sigma modifican la forma de la curva de $g(x)$.

1. Realice una gráfica de la función gaussiana con al menos tres valores de $\sigma$.
2. La gráfica debe tener:
    - ambos ejes identificados,
    - un título, y
    - una leyenda.

## Ejercicio 2:

El archivo `data/temperature-central-park.dat` contiene temperaturas medias en Central Park, New York durante los días de Enero de 2021. Los valores de temperatura vienen dados en Fahrenheit.

1. Lea el archivo de datos usando `numpy.loadtxt`.
2. Convierta los valores de temperaturas de Fahrenheit a Celsius. Ya que no vamos a usar los valores en Fahrenheit, pueden sobreescribir el array donde los guardan.
3. Grafique los valores de temperatura utilizando el tipo de gráfico que creas más adecuado.
4. Verifica de seguir las mejores prácticas para generar gráficos (ejes anotados, unidades, leyenda, título, etc).
5. Guarda la gráfica en un archivo.