![alt text](./assets/matplotlib_logo.png "mat")


## Introducción a Pyplot

`atplotlib.pyplot` es una colección de funciones que hace que matplotlib trabaje como MATLAB. Cada función de pyplot hace algún cambio a una figura. Por ejemplo, crea una figura, crea un área de trazado (plotting) en una figura, traza algunas líneas en un área de trazado, decora el trazado con etiquetas, etc.

En matplotlib.pyplot varios estados se conservan a través de las llamadas a funciones, de modo que realiza un seguimiento de cosas como la figura actual y el área de ploteo. Las funciones de trazado se dirigen a los ejes actuales (Ten en cuenta que "ejes" aquí y en la mayoría de los lugares de la documentación se refiere a la parte de los ejes de una figura y no al término matemático estricto para más de un eje).

Te permite crear y personalizar los tipos de gráficos más comunes, incluyendo:

- Gráfica de barras.
- Histograma.
- Diagramas de sectores.
- Diagramas de violín.
- Gráficos de dispersión o puntos.
- Diagramas de linea
- Diagramas de área.

## Instalando matplotlib

Cuando quieres trabajar con matplotlib localmente, debes correr el siguiente comando:

`pip install matplotlib`\
o\
`conda install matplotlib`
En nuetro caso, 4Geeks ha preparado todo el entorno de manera que puedas trabajar comodamente.

#### Importa el paquete matplotliby el módulo de pyplot de dos maneras diferentes y llámalo "`plt`"
¿Cuál es "correcto"? Revisa PEP8 (https://www.python.org/dev/peps/pep-0008/#imports)

## Creación de charts (gráficos) con matplotlib

Para crear un gráfico con matplolib usualmente se siguen los siguientes pasos:

- Importa el módulo pyplot.
- Define la figura que va a contener el gráfico, la cual es la región (ventana o página) dónde se dibujará y los ejes en los que se dibujarán los datos. Para esto, se usa la función subplots ().
- Grafica los datos en los ejes. Para esto, se usan diferentes funciones dependiendo del tipo de gáfico que quieras.
- Personaliza el gráfico. Para esto, hay muchas funciones que te permiten agregar un título, una leyenda, una cuadrícula, cambiar colores o personalizar los ejes. 
- Guarda el gráfico. Para esto, se usa la función savefig ().
- Enseña el gráfico. Para esto, se usa la función  show ().

Un plot (gráfico) "vacío" se creará si corres las siguientes líneas:
```
# empty plot
fig, ax = plt.subplots()
```

#### Crea un diagrama de dispersión (scatter plot) de la siguiente lista de vectores (★☆☆)
`x = [1, 2, 3, 4], y = [1, 2, 0, 0.5]`

Usa `ax.scatter`

#### Crea un  gráfico de líneas (line plot) de la siguiente lista de vectores (★☆☆)
`x = [1, 2, 3, 4], y = [1, 2, 0, 0.5]`

Usa `ax.plot`

#### Crea una gráfica de área (area plot) de la siguiente lista de vectores (★☆☆)
`x = [1, 2, 3, 4], y = [1, 2, 0, 0.5]`

Usa `ax.fill_between`

#### Crea un gráfico de barras (bar plot) de la siguiente lista de vectores (★☆☆)
`[1, 2, 3], [3, 2, 1]`

Usa `ax.bar`

#### Crea un gráfico de barras (bar plot) horizontal de la siguiente lista de vectores (★☆☆)
`[1, 2, 3], [3, 2, 1]`

Usa `ax.barh`

#### Crea un diagrama de histograma (histogram plot) de un array vectorial con distribución normal como $N ~ (2, 1.5) $ (★★☆)

Nota: Recuerda `np.random` y usa ax.hist

#### Dibuja un gráfico circular (pie chart) de la siguiente lista de vectores (★☆☆)
`[5, 4, 3, 2, 1]`

Usa `ax.pie`

## Diagramas de caja (Boxplots)

La siguiente imágen es una boxplot. Un boxplot es una manera estandarizada de mostrar la distribución de datos basada en un resumen de cinco números ("mínimo", primer cuartil (Q1), mediana, tercer cuartil (Q3) y "máximo"). Te puede informar sobre sus outliers (valores atípicos) y cuáles son sus valores. También puede dicirte si tus datos son siméticos, qué tan estrechamente están agrupados y si y cómo están sesgados.


![alt text](./assets/boxplot.png "boxp")


Los Boxplots tienen las siguientes características:

- Mediana (Q2/percentil 50): el valor medio del DataSet.
- Primer cuartil (Q1/percentil 25): el número medio entre el número más pequeño (no el "mínimo") y la mediana del DataSet.
- Trcer cuartil (Q3/Percentil 75): el valor medio entre la mediana y el valor más alto (no el “máximo”) del DataSet.
- Rango intercuartílico (RIC/IQR): percentil 25 al 75.
- Whiskers (mostrado en azul).
- Outliers (mostrados como círculos verdes).
- "Máximo”: Q3 + 1.5 * IQR.
- “Mínimo”: Q1 - 1.5 * IQR.


Lo que define un outlier, "mínimo" o "máximo" puede no estar claro todavía. Te lo explicaremos en el bootcamp.

#### Crea un boxplot de la siguiente lista de vectores (★☆☆)
Usa `ax.boxplot`

#### Elige una imagen aleatoria de Google, léela con openCV y luego haz un gráfico (★★☆)
Pick a random image from Google, read it with openCV and then make a plot (★★☆)

Usa `cv2.imread`\
Usa `ax.imshow` \

¿Ves la imagen exactamente como es? ¿Qué crees que pasó?

## Cambia la aparencia de los gráficos

Los gráficos creados con matplotlib se pueden personalizar y la apariencia de casi todos los elemnetos pueden ser cambiados. Los elementos que se modifican más frecuentemente son:

- Colores.
- Marcadores de puntos.
- Estilo de líneas
- Títulos.
- Ejes
- Leyenda.
- Estante.

Para cambiar el color de los objetos, usa el parámetro color = color-name, dónde 'color-name' es un string con el nombre del color entre los colores disponibles.

> Chequea la lista completa aquí: https://matplotlib.org/stable/gallery/color/named_colors.html

#### Crea un gráfico de línea con las siguientes listas de vectores y personaliza los colores, marcadores, estilo de línea y títulos (★★☆)

## Múltiples gráficos
Es posible dibujar varios gráficos en diferentes ejes en la misma figura organizada en forma de tablas. Para hacer esto, cuando la figura y los ejes son inicializados, el número de las filas y columnas de la tabla que va a contener los gráficos deben ser pasados a la función de subplots. Con esto, los diferentes ejes se organizan en un array y cada uno de ellos puede ser accesado a través de sus índices. Si quieres que los diferentes ejes compartan los mismos límites para los ejes, puedes pasar los parámetros `sharex = True` por el eje x o `sharey = True` por el eje y.

In [None]:
## Input
s = pd.Series({'Math': 6.0,  'Economy': 4.5, 'Programming': 8.5})


#### Corre el siguiente código y chequea que pasa

In [None]:
import matplotlib.pyplot as plt
fig, ax = plt.subplots(2, 2, sharey = True)
days = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']
temperature = {'Madrid':[28.5, 30.5, 31, 30, 28, 27.5, 30.5], 'Barcelona':[24.5, 25.5, 26.5, 25, 26.5, 24.5, 25]}
ax[0, 0].plot(days, temperature['Madrid'])
ax[0, 1].plot(days, temperature['Barcelona'], color = 'tab:orange')
ax[1, 0].bar(days, temperature['Madrid'])
ax[1, 1].bar(days, temperature['Barcelona'], color = 'tab:orange')
plt.show()

#### Repite los 4 plots que ya hiciste previamente en 4 subplots (★★☆)

## Integración con Pandas

Matplotlib se integra perfectamente con la librería Pandas, permitiendo dibujar gráficos a partir de datos de las series Pandas y DataFrames.

#### Chequea el siguiente código que hace lo mismo que arriba:

In [None]:
import pandas as pd 
import matplotlib.pyplot as plt

df = pd.DataFrame({'Days':['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun'], 
                   'Madrid':[28.5, 30.5, 31, 30, 28, 27.5, 30.5], 
                   'Barcelona':[24.5, 25.5, 26.5, 25, 26.5, 24.5, 25]})
fig, ax = plt.subplots()
df.plot(x = 'Days', y = 'Madrid', ax = ax)
df.plot(x = 'Days', y = 'Barcelona', ax = ax)
plt.show()

#### Lee el archivo titanic_train.csv ubicado en esta carpeta y plotea la media de Edad por el grupo dado por Sexo (★★★)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

pop = pd.read_csv("pop_hist.csv")
pop = pop.iloc[np.where(pop.AGE=="TOTAL") and np.where(pop.LOCATION!="OECD") and (np.where(pop.LOCATION=="ESP") or np.where(pop.LOCATION=="USA")) ]
pop = pop.loc[:,["LOCATION","TIME","Value"]]
pop["Value"] = pop["Value"].astype(int)

fig, ax = plt.subplots()
pop.plot(x = 'TIME', y = 'Value', ax = ax)
pop.plot(x = 'TIME', y = 'Value', ax = ax)
plt.show()


## ¿Qué es la visualización de datos 3D?

Los datos tridimensionales proporcionan la percepción de profundidad, anchura y altura (los puedes ver de cualquier ángulo). Las visualizaciones tridimensionales fueron desarrolladas para proporcionar información cualitativa y cuantitativa sobre un objeto. Son visualizadas con el proceso de tres fases de escena, geometría y renderizado. Los Datasets aumentan de tamaño, la necesidad de análisis y herramientas de visualización para datos tambien se convierten en esenciales. 

Las operaciones de análisis, como las operaciones de visualización, pueden basarse en escenas o en objetos y utilizar métodos para cuantificar la información de los objetos.

Algunos ejemplos de formas 3D son primas, pirámides, esferas, conos, cubos, e incluso figuras!!!! 😲😲.

![alt text](./assets/tea.png)


## ¿Por qué es importante la visualización 3D?

Las visualizaciones tridimensionales representan visualizaciones en todos los ángulos con solo apagar la cámara en la escena. Al considerar los formatos bidimensionales, existe un límite en la cantidad de información que se debe tomar y utilizar la visualización para tomar decisiones, planificar y dirigirse a los clientes. La visualización tridimensional te permite dibujar qué personaje en la escena cambió. Se comunica facilmente con las características internas. Algunas de las aplicaciones incluyen GIS (Sistemas de Información Geográficos), visualizaciones geográficas en una vista tri-dimensional, provee mayor interacción la cual es esencial para el entendimiento. Da una sensación de inmersión del entorno, donde el usuario aprecia la escala del cambio y visualiza el impacto del diseño de edificaciones en el entorno externo y los habitantes. Los ejemplos GIS incluirán planificación de ciudades, planificación de información de construcción, análisis de costas, modelado y evaluación de granjas eólicas.

 #### Sin embargo, veremos en las siguientes lecciones que podemos hacer visualizaciones en 4D e incluso estas superficies no son muy comunes en el análisis de datos.

In [None]:
# We enable three-dimensional plots by importing the mplot3d toolkit
from mpl_toolkits import mplot3d

# Once this submodule is imported, we can create a three-dimensional axes by passing the keyword projection='3d' to any of the normal axes creation routines

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure()
ax = plt.axes(projection='3d')

#### Cambia el nombre de las columnas del DataFrame anterior usando dos métodos diferentes (★★☆)

>Chequea la función `rename`: (https://matplotlib.pydata.org/docs/reference/api/matplotlib.DataFrame.rename.html)

In [None]:
#Three-Dimensional Contour Plots

def f(x,y):
    return np.sin(np.sqrt(x**2+y**2))

x = np.linspace(-6, 6, 30)
y = np.linspace(-6, 6, 30)

X,Y=np.meshgrid(x,y)
Z=f(X,Y)

fig=plt.figure()
ax = plt.axes(projection='3d')
ax.contour3D(X, Y, Z, 50, cmap='binary')
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_zlabel('z')

#Sometimes the default viewing angle is not optimal, in which case we can use the view_init method to set the elevation and azimuthal angles. 

ax.view_init(60,35)
fig