## Matplotlib - Introducción

**Matplotlib** es una de las librería más utilizadas en Python enfocada a la visualización de datos.

- Para visualizar datos podemos usar listas y/o arrays.

Para generar las gráficas más comunes tenemos las siguientes funciones:

|Función          | Plot                        |
|-----------------|-----------------------------|
|**plt.plot()**   |Grafica **X vs Y** (lineal). |
|**plt.scatter()**|Graficas de dispersión.      |
|**plt.bar()**    |Grafico de barras vertical.  |
|**plt.barh()**   |Grafico de barras horizontal.|

Graficos estadísticos:

|Función       |Plot        |
|--------------|------------|
|**plt.hist()**|Histogramas.|

In [None]:
import numpy as np

import matplotlib # Importamos de esta forma para verificar la versión
import matplotlib.pyplot as plt

import random

In [None]:
# Versiones

print(f"numpy=={np.__version__}")
print(f"matplotlib=={matplotlib.__version__}")

### plt.plot()

Se utiliza para crear gráficos de líneas que muestran la relación entre dos variables.

In [None]:
# Graficar un punto
# Usamos la función plt.plot()

x = 0
y = 1

plt.plot(x, y, marker = "o")

plt.grid()
plt.show()

# En este ejemplo x, y son números

# Usamos plt.grid() para mostrar una "malla" cuadriculada gris, muy útil para ubicar los puntos en las gráficas
# Usamos plt.show() para mostrar la gráfica (aunque no es obligatorio en Notebooks)

In [None]:
# Graficar una linea
# Usamos la función plt.plot()

x = [1, 10]
y = [-1, 8]

plt.plot(x, y, marker = "o")


# Esta función la podemos usar para marcar el eje X
plt.axhline(0, color = "black")

# Esta función la podemos usar para marcar el eje Y
plt.axvline(0, color = "black") 

plt.grid()
plt.show()

# En este ejemplo x, y son listas con 2 elementos cada uno
# Ambos tienen el mismo tamaño

# Por defecto, matplotlib uno los puntos con una linea, esto se puede evitar añadiendo el siguiente parámetro ---> linestyle = ""

In [None]:
# Graficar varios puntos
# Usamos la función plt.plot()

x = np.linspace(1, 10, 10)
y = [-3, 7, 10, 6, 3, 9, 0, -6, 2, 9]

plt.plot(x, y, marker = "o", color = "red")

# Eje X
plt.axhline(0, color = "black")

# Eje Y
plt.axvline(0, color = "black") 

plt.grid()
plt.show()

# En este ejemplo x, y son listas de n-números
# Ambos tienen el mismo tamaño

# Usando el parámetro color = "red" cambiamos el color de los puntos

### plt.scatter()

Se utiliza para crear gráficos de dispersión. Estos gráficos son útiles para visualizar la relación entre 2 variables numéricas, donde cada punto del gráfico representa un par de valores $(x, y)$.

In [None]:
# plt.scatter()

# Vamos a generar 2 listas de números aleatorios para generar el gráfico

X = [random.randint(-20, 20) for x in range(20)]
Y = [random.randint(-20, 20) for x in range(20)]

plt.scatter(X, Y)

# Eje X
plt.axhline(0, color = "black")

# Eje Y
plt.axvline(0, color = "black") 

plt.grid()
plt.show()

# plt.scatter() no une los puntos con lineas
# En este ejemplo X, Y son listas de n-números.
# Ambos tienen el mismo tamaño

### plt.bar()

Se utiliza para crear gráficos de barras verticales. Estos gráficos son útiles para visualizar datos categóricos, donde cada barra representa un valor de una categoría específica.

In [None]:
# plt.bar()

# Vamos a crear dos listas
# La primera con datos no numéricos, en este ejemplo con strings
# La segunda con datos numéricos, pueden ser positivos y negativos


categorias = ["A", "B", "C", "D", "E"]
valores = [random.randint(10, 100) for x in range(len(categorias))]


plt.bar(categorias, valores)
plt.grid()
plt.show()

# En este ejemplo categorias es una lista de strings y valores es una lista de números
# Ambos tienen el mismo tamaño

### plt.barh()

Se utiliza para crear gráficos de barras horizontales. Estos gráficos son útiles para visualizar datos categóricos, donde cada barra representa un valor de una categoría específica.

In [None]:
# plt.bar()

# Vamos a crear dos listas
# La primera con datos no numéricos, en este ejemplo con strings
# La segunda con datos numéricos, pueden ser positivos y negativos


categorias = ["A", "B", "C", "D", "E"]
valores = [random.randint(10, 100) for x in range(len(categorias))]


plt.barh(categorias, valores)
plt.grid()
plt.show()

# En este ejemplo categorias es una lista de strings y valores es una lista de números
# Ambos tienen el mismo tamaño

### plt.hist()

Se utiliza para crear histogramas. Estos gráficos son útiles para visualizar la distribución de datos numéricos, donde la altura de cada barra representa la frecuencia de aparición de un valor específico.

In [None]:
# plt.hist()

# Para este ejemplo vamos a generar una lista de 1000 elementos aleatorios entre 0 y 10

X = [random.randint(0, 10) for x in range(1_000)]

plt.hist(X, bins = 11)
plt.grid()
plt.show()

# plt.hist() cuenta cuantas veces se repite cada elemento.
# La altura de cada barra depende de las veces que se repite. Mientras más se repite más alto.

# Más adelante explicaremos el parámetro "bins".

In [None]:
# Podemos verificar la cantidad de cada elemento usando la función Counter

from collections import Counter

print(Counter(X))

In [None]:
##############################################################################################################################