# Basic Plotting with matplotlib

You can show matplotlib figures directly in the notebook by using the `%matplotlib notebook` and `%matplotlib inline` magic commands. 

`%matplotlib notebook` provides an interactive environment.

In [3]:
%matplotlib notebook

In [4]:
import matplotlib as mpl
mpl.get_backend()

'nbAgg'

In [5]:
import matplotlib.pyplot as plt

# Ayuda de pyplot
plt.plot?

In [4]:
# because the default is the line style '-', 
# nothing will be shown if we only pass in one point (3,2)
plt.figure()
plt.plot(3, 2)

# '-' sirve para dibujar líneas

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fee6b04b748>]

In [5]:
# we can pass in '.' to plt.plot to indicate that we want
# the point (3,2) to be indicated with a marker '.'
plt.figure() # creo otra figura para no modificar la anterior
plt.plot(3, 2, '.')

# Ahora aparece un punto en el gráfico de arriba porque estamos en modo interactivo y trabajando sobre el mismo gráfico.

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fee688c8b38>]

Let's see how to make a plot without using the scripting layer.

In [6]:
# Cuando usamos plt estamos generando código que contiene numerosos scripts que hace cosas de manera automática
# En las siguientes lineas vamos a generar un gráfico sin usar los scripts "automáticos".

# First let's set the backend without using mpl.use() from the scripting layer
from matplotlib.backends.backend_agg import FigureCanvasAgg
from matplotlib.figure import Figure

# create a new figure
fig = Figure()

# associate fig with the backend
canvas = FigureCanvasAgg(fig)

# add a subplot to the fig
ax = fig.add_subplot(111)

# plot the point (3,2)
ax.plot(3, 2, '.')

# save the figure to test.png
canvas.print_png('test.png')

We can use html cell magic to display the image.

In [7]:
%%html
<img src='test.png' />

# usamos magic comands para importar la imágen al notebook de jupyter

In [8]:
# Volvemos al modo scripting, donde ya nos basamos en numeros cosas que se crean al usar el comando plt (canvas, etc)

# create a new figure
# Si no creamos una nueva figura, todas las modificaciones que hagamos se harán sobre el gráfico anterior dado que estamos
# en el modo intercativo
plt.figure()

# plot the point (3,2) using the circle marker
plt.plot(3, 2, 'o')

# get the current axes
ax = plt.gca()

# Cambiamos el tamaño de los ejer X e Y
# Set axis properties [xmin, xmax, ymin, ymax]
ax.axis([0,6,0,10])

# Esto es lo mismo que arriba pero sin asignas plt.gca() al obtejo ax
# plt.gca().axis([0,6,0,12])

<IPython.core.display.Javascript object>

[0, 6, 0, 10]

In [32]:
# Vamos a crear un gráfico con 3 series de datos, en este caso tres puntos

# create a new figure
plt.figure()

# plot the point (1.5, 1.5) using the circle marker
plt.plot(1.5, 1.5, 'o')
# plot the point (2, 2) using the circle marker
plt.plot(2, 2, 'o')
# plot the point (2.5, 2.5) using the circle marker
plt.plot(2.5, 2.5, 'o')

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fee10512a90>]

In [33]:
# get current axes
ax = plt.gca()

# get all the child objects the axes contains

# Con esto obtenemos todos los obtejos que componen a nuestro gráfico
# Line2D son las 3 series, o sea, los 3 puntos
# spines son los bordes de las imágenes incluyendo los marcadores
# XAxis y YAxis son los ejes X e Y
# Text son las etiquetas del gráfico

ax.get_children()

# que es igual a
plt.gca().get_children()

[<matplotlib.lines.Line2D at 0x7fee10512908>,
 <matplotlib.lines.Line2D at 0x7fee106692b0>,
 <matplotlib.lines.Line2D at 0x7fee10512a90>,
 <matplotlib.spines.Spine at 0x7fee10649da0>,
 <matplotlib.spines.Spine at 0x7fee105f9048>,
 <matplotlib.spines.Spine at 0x7fee105f95f8>,
 <matplotlib.spines.Spine at 0x7fee105f97b8>,
 <matplotlib.axis.XAxis at 0x7fee105f9198>,
 <matplotlib.axis.YAxis at 0x7fee105a65f8>,
 <matplotlib.text.Text at 0x7fee10566b38>,
 <matplotlib.text.Text at 0x7fee10566ba8>,
 <matplotlib.text.Text at 0x7fee10566c18>,
 <matplotlib.patches.Rectangle at 0x7fee10566c50>]

In [31]:
# Método para obtener la figura en uso
# gcf = get current figure

plt.gcf()

<IPython.core.display.Javascript object>

# Scatterplots

In [72]:
import numpy as np

x = np.array([1,2,3,4,5,6,7,8])
y = x

plt.figure()
plt.scatter(x, y) # similar to plt.plot(x, y, '.'), but the underlying child objects in the axes are not Line2D

<IPython.core.display.Javascript object>

<matplotlib.collections.PathCollection at 0x7fee4b1fd5c0>

In [73]:
import numpy as np

x = np.array([1,2,3,4,5,6,7,8])
y = x

# create a list of colors for each point to have
# ['green', 'green', 'green', 'green', 'green', 'green', 'green', 'red']
colors = ['green']*(len(x)-1)
colors.append('red')

# Creo figura
plt.figure()

# plot the point with size 100 and chosen colors
plt.scatter(x, y, s=100, c=colors)

<IPython.core.display.Javascript object>

<matplotlib.collections.PathCollection at 0x7fee4b19b470>

In [74]:
# convert the two lists into a list of pairwise tuples
zip_generator = zip([1,2,3,4,5], [6,7,8,9,10])

print(list(zip_generator))
# the above prints:
# [(1, 6), (2, 7), (3, 8), (4, 9), (5, 10)]


# Volvemos a crear el objeto porque ahora es una lista
zip_generator = zip([1,2,3,4,5], [6,7,8,9,10])

# Sin el * imprime que es un objeto tipo zip
print(zip_generator)

###########################
# Cuando a una función le pasamos el * delante de un objeto iterable, extrae cada uno de sus objetos en orden
print(*zip_generator)
# the above prints:
# (1, 6) (2, 7) (3, 8) (4, 9) (5, 10)

[(1, 6), (2, 7), (3, 8), (4, 9), (5, 10)]
<zip object at 0x7fee4b162b88>
(1, 6) (2, 7) (3, 8) (4, 9) (5, 10)


In [46]:
# use zip to convert 5 tuples with 2 elements each to 2 tuples with 5 elements each
print(list(zip((1, 6), (2, 7), (3, 8), (4, 9), (5, 10))))
# the above prints:
# [(1, 2, 3, 4, 5), (6, 7, 8, 9, 10)]

# Si aplicamos lo visto arriba:


[(1, 2, 3, 4, 5), (6, 7, 8, 9, 10)]


In [75]:
# Si aplicamos lo visto arriba:

# 1ro generado un objeto zip compuesto por tuplas dobles
zip_generator = zip([1,2,3,4,5], [6,7,8,9,10])


# let's turn the data back into 2 lists

# Si aplicacos zip(* a un objeto zip) vamos a realizar el unpacking de un objeto zip y liberar sus objetos originales
# el objeto llamado zip_generator tiene numerosas tuplas, por lo que tomarás el primer objeto de cada una y las unirá, lo mismo
# con los segundos objetos.

x, y = zip(*zip_generator) # This is like calling zip((1, 6), (2, 7), (3, 8), (4, 9), (5, 10))

print(x)
print(y)
# the above prints:
# (1, 2, 3, 4, 5)
# (6, 7, 8, 9, 10)

print('\nAhora las convertimos a listas:\n')
print(list(x))
print(list(y))

(1, 2, 3, 4, 5)
(6, 7, 8, 9, 10)

Ahora las convertimos a listas:

[1, 2, 3, 4, 5]
[6, 7, 8, 9, 10]


In [76]:
plt.figure()

# Vamos a colorear con distintos colores lo distintos puntos dentro de los datos. Para eso creamos dos series
# Una serie (roja) con los dos primeros datos y otra serie (azul) con los puntos restantes.

# plot a data series 'Tall students' in red using the first two elements of x and y
plt.scatter(x[:2], y[:2], s=100, c='red', label='Tall students')
# plot a second data series 'Short students' in blue using the last three elements of x and y 
plt.scatter(x[2:], y[2:], s=100, c='blue', label='Short students')

<IPython.core.display.Javascript object>

<matplotlib.collections.PathCollection at 0x7fee4b0bcf98>

In [77]:
# add a label to the x axis
plt.xlabel('The number of times the child kicked a ball')
# add a label to the y axis
plt.ylabel('The grade of the student')
# add a title
plt.title('Relationship between ball kicking and grades')

plt.gcf()

<IPython.core.display.Javascript object>

In [78]:
# add a legend (uses the labels from plt.scatter)
plt.legend()

# add the legend to loc=4 (the lower right hand corner), also gets rid of the frame and adds a title
plt.legend(loc=4, frameon=False, title='Legend')

plt.gcf()

<IPython.core.display.Javascript object>

In [79]:
# get children from current axes (the legend is the second to last item in this list)
plt.gca().get_children()

[<matplotlib.collections.PathCollection at 0x7fee4b0bc5f8>,
 <matplotlib.collections.PathCollection at 0x7fee4b0bcf98>,
 <matplotlib.spines.Spine at 0x7fee4b1dd4e0>,
 <matplotlib.spines.Spine at 0x7fee4b1d7c50>,
 <matplotlib.spines.Spine at 0x7fee4b1d7dd8>,
 <matplotlib.spines.Spine at 0x7fee4b1d7080>,
 <matplotlib.axis.XAxis at 0x7fee4b2bd828>,
 <matplotlib.axis.YAxis at 0x7fee4b15c2e8>,
 <matplotlib.text.Text at 0x7fee4b10ab38>,
 <matplotlib.text.Text at 0x7fee4b10aba8>,
 <matplotlib.text.Text at 0x7fee4b10ac18>,
 <matplotlib.legend.Legend at 0x7fee4b08aac8>,
 <matplotlib.patches.Rectangle at 0x7fee4b10ac50>]

In [94]:
# Seleccionamos el objeto referido a la legenda, el segundo desde el final y lo asociamos a la variable legend

# get the legend from the current axes
legend = plt.gca().get_children()[-2]


In [90]:
# Vemos que legend a su vez tiene dos artistas hijos: V
legend.get_children()

[<matplotlib.offsetbox.VPacker at 0x7fee4b15c860>,
 <matplotlib.patches.FancyBboxPatch at 0x7fee4b0f2278>]

In [82]:
# you can use get_children to navigate through the child artists
# Si navegamos sobre el primer hijo vemos que a su vez tiene sub-hijos artistas
legend.get_children()[0].get_children()[1].get_children()[0].get_children()

[<matplotlib.offsetbox.HPacker at 0x7fee4b0d1c50>,
 <matplotlib.offsetbox.HPacker at 0x7fee4b0d1c88>]

In [95]:
# Cómo hacemos pare ver todos los hijos de un artista?
# Generamos  una función recursiva para que explore todos lo niveles que hay debajo de un artista

# import the artist class from matplotlib
from matplotlib.artist import Artist

# Generamos una función recursiva para ver todos los elementos que componen al elemento "Legend"
def rec_gc(art, depth=0):
    if isinstance(art, Artist):
        # increase the depth for pretty printing
        # Agrego lineas para ver los elementos y sus anidaciones
        print("-" * depth + str(art))
        for child in art.get_children():
            rec_gc(child, depth+2)

# Call this function on the legend artist to see what the legend is made up of
# Le aplicamos la función al artista plt.legend
rec_gc(plt.legend())

Legend
--<matplotlib.offsetbox.VPacker object at 0x7fee4b08a1d0>
----<matplotlib.offsetbox.TextArea object at 0x7fee4b04c198>
------Text(0,0,'None')
----<matplotlib.offsetbox.HPacker object at 0x7fee4b100860>
------<matplotlib.offsetbox.VPacker object at 0x7fee4b04cb00>
--------<matplotlib.offsetbox.HPacker object at 0x7fee4b04cb38>
----------<matplotlib.offsetbox.DrawingArea object at 0x7fee4b04ceb8>
------------<matplotlib.collections.PathCollection object at 0x7fee4b0530f0>
----------<matplotlib.offsetbox.TextArea object at 0x7fee4b04cb70>
------------Text(0,0,'Tall students')
--------<matplotlib.offsetbox.HPacker object at 0x7fee4b04c0f0>
----------<matplotlib.offsetbox.DrawingArea object at 0x7fee4b053438>
------------<matplotlib.collections.PathCollection object at 0x7fee4b053630>
----------<matplotlib.offsetbox.TextArea object at 0x7fee4b053160>
------------Text(0,0,'Short students')
--FancyBboxPatch(0,0;1x1)


# Line Plots

In [6]:
import numpy as np

linear_data = np.array([1,2,3,4,5,6,7,8])
exponential_data = linear_data**2

plt.figure()
# plot the linear data and the exponential data

# Hacemos gráfico con las dos series, notas que no se explicitaton los valores del eje x, por lo que se asumen empezando desde
# el valor 0.

plt.plot(linear_data, '-o', exponential_data, '-o')

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fb5904a22e8>,
 <matplotlib.lines.Line2D at 0x7fb5904a2470>]

In [7]:
# plot another series with a dashed red line

# Agregamos otra serie
plt.plot([22,44,55], '--r')

plt.gcf()

<IPython.core.display.Javascript object>

In [8]:
plt.xlabel('Some data')
plt.ylabel('Some other data')
plt.title('A title')

# add a legend with legend entries (because we didn't have labels when we plotted the data series)


# Como no explicitamos los labels de las series lo podemos hacer ahora:
plt.legend(['Baseline', 'Competition', 'Us'])

<matplotlib.legend.Legend at 0x7fb5900516d8>

In [9]:
# fill the area between the linear data and exponential data
plt.gca().fill_between(range(len(linear_data)), 
                       linear_data, exponential_data, 
                       facecolor='blue', 
                       alpha=0.25)

<matplotlib.collections.PolyCollection at 0x7fb5903c1470>

Let's try working with dates!

In [10]:
plt.figure()

# Numpy puede generar un array de fechas, si le asignamos comienzo y final
observation_dates = np.arange('2017-01-01', '2017-01-09', dtype='datetime64[D]')


# Ahora explicitamos eje x (observation_dates) y dos series con valores en el eje y (linear_data y exponential_data)
plt.plot(observation_dates, linear_data, '-o',  observation_dates, exponential_data, '-o')

observation_dates

# Si bien la fechas fueron tomadas correctamente, plt las toma mal, las toma como números, ver el eje x del sig. gráfico

<IPython.core.display.Javascript object>

array(['2017-01-01', '2017-01-02', '2017-01-03', '2017-01-04',
       '2017-01-05', '2017-01-06', '2017-01-07', '2017-01-08'], dtype='datetime64[D]')

Let's try using pandas

In [11]:
# Vamos a solucionar (una opción) usando datetime de pandas

import pandas as pd

# Creamos gráfico
plt.figure()
# Generamos fechas
observation_dates = np.arange('2017-01-01', '2017-01-09', dtype='datetime64[D]')
# Convertimos a pd.to_datetime usando la función map y pandas
observation_dates = map(pd.to_datetime, observation_dates) # trying to plot a map will result in an error

# Esto tirará un error al querer graficar porque map es un iterador
print(observation_dates)


# Ahora graficamos
plt.plot(observation_dates, linear_data, '-o',  observation_dates, exponential_data, '-o')

<IPython.core.display.Javascript object>

<map object at 0x7fb5728cf390>


TypeError: object of type 'map' has no len()

In [12]:
# Se resuelve aplicando la función lista al iterador del tipo map

plt.figure()
observation_dates = np.arange('2017-01-01', '2017-01-09', dtype='datetime64[D]')
# Acá lo solucionamos
# convert the map to a list to get rid of the error
observation_dates = list(map(pd.to_datetime, observation_dates))
plt.plot(observation_dates, linear_data, '-o',  observation_dates, exponential_data, '-o')

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fb570013fd0>,
 <matplotlib.lines.Line2D at 0x7fb57001f0f0>]

In [120]:
# Miro que artistas tiene el gráfico
plt.gca()

# Vemos que tiene un artista, tendrá hijos?

<matplotlib.axes._subplots.AxesSubplot at 0x7fee4d86ca58>

In [13]:
# Miro los sub-hijos del artista "axes" del gráfico

plt.gca().get_children()

# Como vemos tiene muchos hijos, y estos a su vez tendrán hijos??

[<matplotlib.lines.Line2D at 0x7fb570013fd0>,
 <matplotlib.lines.Line2D at 0x7fb57001f0f0>,
 <matplotlib.spines.Spine at 0x7fb5729002e8>,
 <matplotlib.spines.Spine at 0x7fb570099278>,
 <matplotlib.spines.Spine at 0x7fb570099668>,
 <matplotlib.spines.Spine at 0x7fb570099438>,
 <matplotlib.axis.XAxis at 0x7fb5700999b0>,
 <matplotlib.axis.YAxis at 0x7fb57003b828>,
 <matplotlib.text.Text at 0x7fb5700696d8>,
 <matplotlib.text.Text at 0x7fb570069748>,
 <matplotlib.text.Text at 0x7fb5700697b8>,
 <matplotlib.patches.Rectangle at 0x7fb5700697f0>]

In [14]:
plt.gca().xaxis

<matplotlib.axis.XAxis at 0x7fb5700999b0>

In [142]:
# Pero las fechas están apelotonadas y no pueden leerse, por ende vamos a girarlas 45 grados

# Generamos una función recursiva para ver todos los artistas que componen al gráfico, plt.axes.XAxis(), o sea el artista principal
def rec_gc(art, depth=0):
    if isinstance(art, Artist):
        # increase the depth for pretty printing
        # Agrego lineas para ver los elementos y sus anidaciones
        print("-" * depth + str(art))
        for child in art.get_children():
            rec_gc(child, depth+2)
            
# Miramos que elementos hay dentro del artista XAxis
rec_gc(plt.gca().get_children()[-6])

# Vemos que están las 8 fechas dentro de XTick

XAxis(80.000000,52.800000)
--Text(0.5,-29.0342,'Date')
--Text(1,-27.6453,'')
--<matplotlib.axis.XTick object at 0x7fee10040e80>
----Line2D((736330,0))
----Line2D()
----Line2D((0,0),(0,1))
----Text(736330,0,'2017-01-01')
----Text(0,1,'2017-01-01')
--<matplotlib.axis.XTick object at 0x7fee4d885f60>
----Line2D((736331,0))
----Line2D()
----Line2D((0,0),(0,1))
----Text(736331,0,'2017-01-02')
----Text(0,1,'2017-01-02')
--<matplotlib.axis.XTick object at 0x7fee0837ca90>
----Line2D((736332,0))
----Line2D()
----Line2D((0,0),(0,1))
----Text(736332,0,'2017-01-03')
----Text(0,1,'2017-01-03')
--<matplotlib.axis.XTick object at 0x7fee0830d7b8>
----Line2D((736333,0))
----Line2D()
----Line2D((0,0),(0,1))
----Text(736333,0,'2017-01-04')
----Text(0,1,'2017-01-04')
--<matplotlib.axis.XTick object at 0x7fee083151d0>
----Line2D((736334,0))
----Line2D()
----Line2D((0,0),(0,1))
----Text(736334,0,'2017-01-05')
----Text(0,1,'2017-01-05')
--<matplotlib.axis.XTick object at 0x7fee08315ba8>
----Line2D((736335,0))

In [15]:
x = plt.gca().xaxis
# es un shortcut de plt.gca().get_children()[-6]

# rotate the tick labels for the x axis
# A cada una de las 8 fechas le aplicamos una rotación de 45 grados
for item in x.get_ticklabels():
    print(item)
    item.set_rotation(45)

Text(736330,0,'2017-01-01')
Text(736331,0,'2017-01-02')
Text(736332,0,'2017-01-03')
Text(736333,0,'2017-01-04')
Text(736334,0,'2017-01-05')
Text(736335,0,'2017-01-06')
Text(736336,0,'2017-01-07')
Text(736337,0,'2017-01-08')


In [16]:
# Ahora que giramos las fechas no pueden verse porque sobresalen del cuadro del gráfico, por lo que agregamos un espacio inferior

# adjust the subplot so the text doesn't run off the image
plt.subplots_adjust(bottom=0.25)

plt.gcf()

<IPython.core.display.Javascript object>

In [23]:
# Otra forma de asignar nombres al gráfico

ax = plt.gca()
ax.set_xlabel('Date')
ax.set_ylabel('Units')
ax.set_title('Exponential vs. Linear performance')

ax.get_children()

[<matplotlib.lines.Line2D at 0x7fb570013fd0>,
 <matplotlib.lines.Line2D at 0x7fb57001f0f0>,
 <matplotlib.spines.Spine at 0x7fb5729002e8>,
 <matplotlib.spines.Spine at 0x7fb570099278>,
 <matplotlib.spines.Spine at 0x7fb570099668>,
 <matplotlib.spines.Spine at 0x7fb570099438>,
 <matplotlib.axis.XAxis at 0x7fb5700999b0>,
 <matplotlib.axis.YAxis at 0x7fb57003b828>,
 <matplotlib.text.Text at 0x7fb5700696d8>,
 <matplotlib.text.Text at 0x7fb570069748>,
 <matplotlib.text.Text at 0x7fb5700697b8>,
 <matplotlib.patches.Rectangle at 0x7fb5700697f0>]

In [35]:
print(type(ax))

<class 'matplotlib.axes._subplots.AxesSubplot'>


In [24]:
# Plt asume formato LaTeX para escribir sus textos
# para que lo detecte debe estar rodeado de símbolos $

# you can add mathematical expressions in any text element
ax.set_title("Exponential ($x^2$) vs. Linear ($x$) performance")

# La $x$ lo que hace es poner a la x en itálica, que es parte del formato LaTeX que usa fórmulas matemáticas en itálica
# Cheat sheet
# https://users.dickinson.edu/~richesod/latex/latexcheatsheet.pdf

plt.gcf()

<IPython.core.display.Javascript object>

# Bar Charts

In [None]:
plt.figure()
xvals = range(len(linear_data))
plt.bar(xvals, linear_data, width = 0.3)

In [None]:
new_xvals = []

# plot another set of bars, adjusting the new xvals to make up for the first set of bars plotted
for item in xvals:
    new_xvals.append(item+0.3)

plt.bar(new_xvals, exponential_data, width = 0.3 ,color='red')

In [None]:
from random import randint
linear_err = [randint(0,15) for x in range(len(linear_data))] 

# This will plot a new set of bars with errorbars using the list of random error values
plt.bar(xvals, linear_data, width = 0.3, yerr=linear_err)

In [None]:
# stacked bar charts are also possible
plt.figure()
xvals = range(len(linear_data))
plt.bar(xvals, linear_data, width = 0.3, color='b')
plt.bar(xvals, exponential_data, width = 0.3, bottom=linear_data, color='r')

In [None]:
# or use barh for horizontal bar charts
plt.figure()
xvals = range(len(linear_data))
plt.barh(xvals, linear_data, height = 0.3, color='b')
plt.barh(xvals, exponential_data, height = 0.3, left=linear_data, color='r')