<a href="https://colab.research.google.com/github/DCDPUAEM/DCDP_2022/blob/main/01%20Programaci%C3%B3n%20en%20Python/notebooks/Plots.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Matplotlib

[Matplotlib](https://matplotlib.org/) es una librería para la creación de gráficas en Python, ésta contiene múltiples opciones para la creación de gráficas personalizadas.

El módulo pyplot es utilizado y normalmente se utiliza el alias plt:

In [None]:
import matplotlib.pyplot as plt

Los principales pasos para la creación de gráficas en matplotlib son:

1. Preparar los datos (Usando Python, Numpy o Pandas).
2. Personalizar y crear la gráfica.
3. Guardar y/o mostrar la gráfica.


Preparar los datos:

In [None]:
x = [1, 2, 3, 4]
y = [12, 15, 18, 21]

Crear y personalizar:

In [None]:
plt.plot(x, y, color = 'green', linewidth = 3)

Mostrar la gráfica:

In [None]:
plt.show()

## Principales tipos de gráficas:

[Línea](https://matplotlib.org/api/_as_gen/matplotlib.pyplot.plot.html#matplotlib.pyplot.plot)

In [None]:
x  = [1, 2, 3, 4, 5, 6, 7, 8, 9]
y1 = [1, 3, 5, 3, 1, 3, 5, 3, 1]
y2 = [2, 4, 6, 4, 2, 4, 6, 4, 2]
plt.plot(x, y1, label="A")
plt.plot(x, y2, label="B", linestyle = '--')

plt.xlabel("x")
plt.ylabel("y")
plt.title("Grafica de linea")
plt.legend()
plt.show()

[Dispersión](https://matplotlib.org/api/_as_gen/matplotlib.pyplot.scatter.html#matplotlib.pyplot.scatter)

In [None]:
x1 = [2, 3, 4]
y1 = [5, 5, 5]

x2 = [1, 2, 3, 4, 5]
y2 = [2, 3, 2, 3, 4]
y3 = [6, 8, 7, 8, 7]

plt.scatter(x1, y1)
plt.scatter(x2, y2, marker='*', color='g')
plt.scatter(x2, y3, marker='^', color='r')
plt.title('Grafica de dispersion')
plt.show()

[Histogramas](https://matplotlib.org/api/_as_gen/matplotlib.pyplot.hist.html#matplotlib.pyplot.hist)

In [None]:
import numpy as np

# Use numpy to generate a bunch of random data in a bell curve around 5.
n = np.random.randn(1000)

plt.hist(n, bins=20)
plt.title("Histograma")
plt.show()

[Barras](https://matplotlib.org/api/_as_gen/matplotlib.pyplot.bar.html#matplotlib.pyplot.bar)

In [None]:
# Look at index 4 and 6, which demonstrate overlapping cases.
x1 = [1, 3, 4, 5, 6, 7, 9]
y1 = [4, 7, 2, 4, 7, 8, 3]

x2 = [2, 4, 6, 8, 10]
y2 = [5, 6, 2, 6, 2]

plt.bar(x1, y1, label="Azul", color='b')
plt.bar(x2, y2, label="Rojo", color='r')
plt.plot()

plt.xlabel("numero")
plt.ylabel("altura")
plt.title("Grafica de barra")
plt.legend()
plt.show()

[Pastel](https://matplotlib.org/api/_as_gen/matplotlib.pyplot.pie.html#matplotlib.pyplot.pie)

In [None]:
labels = 'A', 'B', 'C'
sections = [56, 66, 24]
colors = ['c', 'g', 'y']

plt.pie(sections, labels=labels, colors=colors,
        startangle=90,
        explode = (0, 0.1, 0),
        autopct = '%1.2f%%')

plt.axis('equal') 
plt.title('Grafica de pastel')
plt.show()

[boxplot](https://matplotlib.org/api/_as_gen/matplotlib.pyplot.boxplot.html#matplotlib.pyplot.boxplot)

<img src=https://miro.medium.com/max/18000/1*2c21SkzJMf3frPXPAR_gZA.png width=600>

_Fuente:[understanding Boxplots](https://towardsdatascience.com/understanding-boxplots-5e2df7bcbd51)_

In [None]:
import numpy as np

# una semilla fija
np.random.seed(2)

# datos aleatorios
all_data = [np.random.normal(0, std, 100) for std in range(6, 10)]

# grafica box plot
plt.boxplot(all_data)
plt.title('Box plot')

plt.xticks([y + 1 for y in range(len(all_data))], labels=['x1', 'x2', 'x3', 'x4'])

plt.show()

Muchos otros tipos de gráficas pueden ser generadas con matplotlib, visita la [página de ejemplos](https://matplotlib.org/gallery/index.html) para darte una idea.

# Seaborn

[Seaborn](http://seaborn.pydata.org/) es una librería de visualización en Python que trabaja sobre matplotlib, proveyendo una interfaz de alto nivel para la creación de gráficas estilizadas.

El módulo seaborn utiliza comúnmente el alias sns:

In [None]:
import seaborn as sns

Tipos de gráficas que pueden ser generadas con seaborn:

* Relación, gráficas para visualizar la relación estadística de los datos.
* Categóricas, gráficas para visualizar variables categóricas.
* Distribución, gráficas útiles para mostrar la estructura del conjunto de datos.
* Regresión, gráficas que son generadas usando un modelo de regresión automáticamente.
* Matrices, gráficas para mostrar relaciones en datos en forma de matriz.

Puedes visitar la [página de introducción de seaborn](http://seaborn.pydata.org/introduction.html) o la [página de la API](http://seaborn.pydata.org/api.html) para ver todos los métodos que seaborn provee.

[Relación](http://seaborn.pydata.org/generated/seaborn.relplot.html#seaborn.relplot)

In [None]:
#cargar un dataset de ejemplo
tips = sns.load_dataset("tips")
tips.head(5)

In [None]:
sns.relplot(x="total_bill", y="tip", hue="day", data=tips)

In [None]:
#cargar otro dataset de ejemplo
fmri = sns.load_dataset("fmri")
fmri.head(5)

In [None]:
#una grafica de linea
sns.relplot(x="timepoint", y="signal", hue="event", style="event", col="region", kind="line", data=fmri)

[Categóricas](http://seaborn.pydata.org/api.html#categorical-plots)

In [None]:
#cargar un dataset de ejemplo
tips = sns.load_dataset("tips")

In [None]:
#dispersion por categoria
sns.stripplot(x="day", y="total_bill", data=tips)

In [None]:
#de barras
sns.barplot(x="day", y="total_bill", hue="sex", data=tips)

In [None]:
#box
sns.boxplot(x="day", y="total_bill", data=tips)

[Distribución](http://seaborn.pydata.org/api.html#distribution-plots)

In [None]:
import numpy as np

#histograma con estimacion de la densidad
x = np.random.randn(100)
sns.distplot(x)

[Regresión](http://seaborn.pydata.org/api.html#regression-plots)

In [None]:
import numpy as np
# generar datos
num_points = 20

# x es 5, 6, 7... mas un movimiento aleatorio pequeño
x = 5 + np.arange(num_points) + np.random.randn(num_points)

# y es 10, 11, 12... mas un movimiento aleatorio alto
y = 10 + np.arange(num_points) + 6 * np.random.randn(num_points)

#genera la grafica con una linea de regresion calculada automaticamente por seaborn
sns.regplot(x, y)

[Matrices](http://seaborn.pydata.org/api.html#matrix-plots)

In [None]:
# Cargar un set de datos de ejemplo
flights_long = sns.load_dataset("flights")
flights = flights_long.pivot("month", "year", "passengers")
flights

In [None]:
# Crear un mapa de calor con seaborn
f, ax = plt.subplots(figsize=(9, 6))
sns.heatmap(flights, annot=True, fmt="d", linewidths=.5, ax=ax)

Visita la [página de ejemplos](http://seaborn.pydata.org/examples/index.html) para ver una galería de gráficas que pueden ser generadas con seaborn.

# Pandas

Pandas también provee algunos [métodos para la visualización](https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html) directamente usando objetos DataFrames o Series.

In [None]:
import pandas as pd

Por ejemplo, una gráfica de línea usando una serie de tiempo:

In [None]:
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()

ts.plot()

De manera similar usando las columnas de un DataFrame:

In [None]:
df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index, columns=['A', 'B', 'C', 'D'])
df = df.cumsum()

plt.figure()

df.plot()

plt.legend(loc='best')

[Dispersión:](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.scatter.html#pandas.DataFrame.plot.scatter)


In [None]:
df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1], [6.4, 3.2, 1], [5.9, 3.0, 2]], columns=['length', 'width', 'species'])
df.plot.scatter(x='length', y='width', c='species', colormap='viridis')

[Histogramas:](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.hist.html#pandas.DataFrame.plot.hist)

In [None]:
df = pd.DataFrame(np.random.randn(6000), columns = ['u_0_1'])
df['u_3_2'] = (df['u_0_1'] + 3)*2
df.plot.hist(bins=20, alpha=0.5)

[Barras:](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.bar.html#pandas.DataFrame.plot.bar)

In [None]:
df = pd.DataFrame({'lab':['A', 'B', 'C'], 'val':[10, 30, 20]})
df.plot.bar(x='lab', y='val', rot=0)

[Pastel:](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.pie.html#pandas.DataFrame.plot.pie)

In [None]:
df = pd.DataFrame({'mass': [0.330, 4.87 , 5.97], 'radius': [2439.7, 6051.8, 6378.1]}, index=['Mercury', 'Venus', 'Earth'])
df.plot.pie(y='mass', figsize = (7, 7))

[Box:](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.box.html#pandas.DataFrame.plot.box)

In [None]:
df = pd.DataFrame(np.random.randn(25, 4), columns=list('ABCD'))
df.plot.box()