# Práctica de Matplotlib 📊

Este cuaderno ofrece un conjunto de ejercicios para diferentes tareas con Matplotlib.

Cabe señalar que puede haber más de una forma diferente de responder a una pregunta o completar un ejercicio.

Las diferentes tareas estarán detalladas por comentarios o texto.

Para más referencias y recursos, se recomienda consultar la [documentación de Matplotlib](https://matplotlib.org/stable/users/index.html).

In [1]:
# Import the pyplot module from matplotlib as plt and make sure 
# plots appear in the notebook using '%matplotlib inline'


In [2]:
# Create a simple plot using plt.plot()


In [3]:
# Plot a single Python list


In [4]:
# Create two lists, one called X, one called y, each with 5 numbers in them


In [5]:
# Plot X & y (the lists you've created)


Hay otra forma de crear gráficos con Matplotlib, se conoce como el método orientado a objetos (OO). Probémoslo.

In [6]:
# Create a plot using plt.subplots()


In [7]:
# Create a plot using plt.subplots() and then add X & y on the axes


Ahora intentemos un pequeño flujo de trabajo con matplotlib.

In [8]:
# Import and get matplotlib ready


# Prepare data (create two lists of 5 numbers, X & y)


# Setup figure and axes using plt.subplots()


# Add data (X, y) to axes


# Customize plot by adding a title, xlabel and ylabel


# Save the plot to file using fig.savefig()


Está bien, este es un gráfico de líneas simple, ¿qué tal algo un poco diferente?

Para ayudarnos, importaremos NumPy.

In [9]:
# Import NumPy as np


In [10]:
# Create an array of 100 evenly spaced numbers between 0 and 100 using NumPy and save it to variable X


In [11]:
# Create a plot using plt.subplots() and plot X versus X^2 (X squared)


Comenzaremos con diagramas de dispersión.

In [12]:
# Create a scatter plot of X versus the exponential of X (np.exp(X))


In [13]:
# Create a scatter plot of X versus np.sin(X)


¿Qué tal si probamos otro tipo de gráfico? Esta vez veamos un gráfico de barras. Primero, crearemos algunos datos.

In [14]:
# Create a Python dictionary of 3 of your favourite foods with 
# The keys of the dictionary should be the food name and the values their price


In [15]:
# Create a bar graph where the x-axis is the keys of the dictionary
# and the y-axis is the values of the dictionary


# Add a title, xlabel and ylabel to the plot


In [16]:
# Make the same plot as above, except this time make the bars go horizontal


Toda esta planificación de comida me está dando hambre. Pero tenemos un par de gráficos por hacer.

Veamos un histograma.

In [17]:
# Create a random NumPy array of 1000 normally distributed numbers using NumPy and save it to X


# Create a histogram plot of X


In [18]:
# Create a NumPy array of 1000 random numbers and save it to X


# Create a histogram plot of X


Observe cómo las distribuciones (dispersión de datos) son diferentes. ¿Por qué difieren?

¿Qué más puedes averiguar sobre la distribución normal?

¿Puedes pensar en otros tipos de datos que puedan estar normalmente distribuidos?

Estas preguntas no están directamente relacionadas con la representación gráfica o Matplotlib, pero son útiles para reflexionar.

Ahora intentemos hacer algunos subgráficos. Un subgráfico es otro nombre para una figura con múltiples gráficos en ella.

In [19]:
# Create an empty subplot with 2 rows and 2 columns (4 subplots total)


Observe cómo el subplot tiene múltiples figuras. Ahora agreguemos datos a cada eje.

In [20]:
# Create the same plot as above with 2 rows and 2 columns and figsize of (10, 5)


# Plot X versus X/2 on the top left axes


# Plot a scatter plot of 10 random numbers on each axis on the top right subplot


# Plot a bar graph of the favourite food keys and values on the bottom left subplot


# Plot a histogram of 1000 random normally distributed numbers on the bottom right subplot


Vaya. Hay mucho de lo que hablar allí.

Ahora hemos visto cómo graficar con Matplotlib y datos directamente. Practiquemos usando Matplotlib para graficar con pandas.

Primero necesitaremos importar pandas y crear un DataFrame con el que trabajar.

In [21]:
# Import pandas as pd


In [22]:
# Import the '../data/car-sales.csv' into a DataFame called car_sales and view


In [23]:
# Try to plot the 'Price' column using the plot() function


¿Por qué no funciona?

Consejo: No son datos numéricos.

En el proceso de convertirlo a datos numéricos, creemos otra columna que sume el total de ventas y otra que muestre en qué fecha se vendió el coche.

Consejo: Para agregar una columna de manera acumulativa, busca la función cumsum(). Y para crear una columna de fechas, busca la función date_range().

In [24]:
# Remove the symbols, the final two numbers from the 'Price' column and convert it to numbers


In [25]:
# Add a column called 'Total Sales' to car_sales which cumulatively adds the 'Price' column


# Add a column called 'Sale Date' which lists a series of successive dates starting from today (your today)

# View the car_sales DataFrame


Ahora que tenemos una columna numérica (`Total Sales`) y una columna de fechas (`Sale Date`), vamos a visualizarlas.

In [26]:
# Use the plot() function to plot the 'Sale Date' column versus the 'Total Sales' column


In [27]:
# Convert the 'Price' column to the integers


# Create a scatter plot of the 'Odometer (KM)' and 'Price' column using the plot() function


In [28]:
# Create a NumPy array of random numbers of size (10, 4) and save it to X


# Turn the NumPy array X into a DataFrame with columns called ['a', 'b', 'c', 'd']


# Create a bar graph of the DataFrame


In [29]:
# Create a bar graph of the 'Make' and 'Odometer (KM)' columns in the car_sales DataFrame


In [30]:
# Create a histogram of the 'Odometer (KM)' column


In [31]:
# Create a histogram of the 'Price' column with 20 bins


Ahora hemos visto algunos ejemplos de graficar directamente desde DataFrames utilizando el conjunto de datos `car_sales`.

Intentemos usar un conjunto de datos diferente.

In [32]:
# Import "../data/heart-disease.csv" and save it to the variable "heart_disease"


In [33]:
# View the first 10 rows of the heart_disease DataFrame


In [34]:
# Create a histogram of the "age" column with 50 bins


In [35]:
# Call plot.hist() on the heart_disease DataFrame and toggle the
# "subplots" parameter to True


Ese gráfico se ve bastante comprimido. Cambiemos el tamaño de la figura.

In [36]:
# Call the same line of code from above except change the "figsize" parameter
# to be (10, 30)


Ahora intentemos comparar dos variables con respecto a la variable objetivo.

Más específicamente, veremos cómo la edad y el colesterol combinados afectan la variable objetivo en **pacientes mayores de 50 años**.

In [37]:
# Replicate the above plot in whichever way you see fit

# Note: The method below is only one way of doing it, yours might be
# slightly different

# Create DataFrame with patients over 50 years old


# Create the plot


# Plot the data


# Customize the plot


# Add a meanline


Hermoso, ahora has creado un gráfico de dos variables diferentes, cambiemos el estilo.

In [38]:
# Check what styles are available under plt


In [39]:
# Change the style to use "seaborn-whitegrid"


Ahora que se ha cambiado el estilo, volvamos a graficar la misma figura de arriba y veamos cómo se ve.

In [40]:
# Reproduce the same figure as above with the "seaborn-whitegrid" style

# Create the plot


# Plot the data


# Customize the plot


# Add a meanline


Maravilloso, has cambiado el estilo de los gráficos y la figura se ve diferente, pero los puntos no son de un muy buen color.

Cambiemos el parámetro `cmap` de `scatter()` así como el parámetro `color` de `axhline()` para solucionarlo.

In [41]:
# Replot the same figure as above except change the "cmap" parameter
# of scatter() to "winter"
# Also change the "color" parameter of axhline() to "red"

# Create the plot


# Plot the data


# Customize the plot


# Add a meanline


¡Genial! Ahora nuestra figura tiene un esquema de colores mejorado, guardémosla en un archivo.

In [42]:
# Save the current figure using savefig(), the file name can be anything you want


In [43]:
# Reset the figure by calling plt.subplots()


## Extensiones

Para más ejercicios, consulta la [página de tutoriales de Matplotlib](https://matplotlib.org/stable/tutorials/index.html). Una buena práctica sería leerlo todo y, para las partes que encuentres interesantes, añadirlas al final de este cuaderno.

El siguiente lugar al que podrías ir es la [página de Stack Overflow para las preguntas y respuestas más relevantes sobre Matplotlib](https://stackoverflow.com/questions/tagged/matplotlib?sort=MostVotes&edited=true). A menudo, encontrarás algunas de las funciones de Matplotlib más comunes y útiles aquí. ¡No olvides experimentar con los filtros de Stack Overflow! Es probable que encuentres algo útil aquí.

Finalmente, como siempre, recuerda que la mejor manera de aprender algo nuevo es intentarlo. Y probarlo sin descanso. Siempre pregúntate: "¿hay una mejor manera de visualizar estos datos para que sea más fácil de entender?"