# Simple Line Plots

Quizás el más simple de todos los gráficos es la visualización de una sola función $y = f(x)$.

Aquí echaremos un primer vistazo a la creación de un gráfico simple de este tipo.
Como en todas las secciones siguientes, empezaremos por **configurar el notebook e importar los paquetes que utilizaremos:**

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('seaborn-whitegrid')
import numpy as np

Para todos los gráficos de Matplotlib, empezamos creando una figura y unos ejes.
En su forma más sencilla, una figura y unos ejes se pueden crear de la siguiente manera:

In [None]:
fig = plt.figure()
ax = plt.axes()

En Matplotlib, la *figura* (una instancia de la clase ``plt.Figure``) puede ser considerada como un único **contenedor que contiene todos los objetos que representan los ejes, los gráficos, el texto y las etiquetas.**
Los *ejes* (una instancia de la clase ``plt.Axes``) es lo que vemos arriba: una caja delimitadora con **puntos y etiquetas, que eventualmente contendrá los elementos del gráfico que conforman nuestra visualización.**
A lo largo de este libro, utilizaremos comúnmente el nombre de variable ``fig`` para referirnos a una instancia de figura, y ``ax`` para referirnos a una instancia de eje o grupo de instancias de eje.

Una vez que hemos creado un eje, podemos utilizar la función ``ax.plot`` para trazar algunos datos. Empecemos con una simple sinusoide:

In [None]:
fig = plt.figure()
ax = plt.axes()

x = np.linspace(0, 10, 1000)
ax.plot(x, np.sin(x));

Alternativamente, podemos utilizar la interfaz de pylab y dejar que la figura y los ejes se creen por nosotros en segundo plano


In [None]:
plt.plot(x, np.sin(x));

Si queremos crear una sola figura con múltiples líneas, podemos simplemente llamar a la función ``plot`` varias veces:

In [None]:
plt.plot(x, np.sin(x));
plt.plot(x, np.cos(x));

¡Eso es todo lo que hay que hacer para dibujar funciones simples en Matplotlib!
Ahora nos sumergiremos en algunos detalles más sobre cómo controlar la apariencia de los ejes y las líneas.

## Ajustando el gráfico: Color de las lineas y estilos

El primer ajuste que se puede hacer a un gráfico es controlar los colores y estilos de las líneas.
La función ``plt.plot()`` toma argumentos adicionales que pueden ser utilizados para especificar estos.
Para ajustar el color, puede utilizar la palabra clave ``color``, que acepta un argumento de cadena que representa prácticamente cualquier color imaginable.
El color se puede especificar de varias maneras:

In [None]:
plt.plot(x, np.sin(x - 0), color='blue')        # specify color by name
plt.plot(x, np.sin(x - 1), color='g')           # short color code (rgbcmyk)
plt.plot(x, np.sin(x - 2), color='0.75')        # Grayscale between 0 and 1
plt.plot(x, np.sin(x - 3), color='#FFDD44')     # Hex code (RRGGBB from 00 to FF)
plt.plot(x, np.sin(x - 4), color=(1.0,0.2,0.3)) # RGB tuple, values 0 to 1
plt.plot(x, np.sin(x - 5), color='chartreuse'); # all HTML color names supported

Si no se especifica ningún color, Matplotlib recorrerá automáticamente un conjunto de colores por defecto para múltiples líneas.

Del mismo modo, el estilo de las líneas puede ajustarse utilizando la palabra clave ``linestyle``:

In [None]:
plt.plot(x, x + 0, linestyle='solid')
plt.plot(x, x + 1, linestyle='dashed')
plt.plot(x, x + 2, linestyle='dashdot')
plt.plot(x, x + 3, linestyle='dotted');

# For short, you can use the following codes:
plt.plot(x, x + 4, linestyle='-')  # solid
plt.plot(x, x + 5, linestyle='--') # dashed
plt.plot(x, x + 6, linestyle='-.') # dashdot
plt.plot(x, x + 7, linestyle=':');  # dotted

Si quiere ser extremadamente conciso, estos códigos ``linestyle`` y ``color`` pueden combinarse en un único argumento sin palabras clave para la función ``plt.plot()``:

In [None]:
plt.plot(x, x + 0, '-g')  # solid green
plt.plot(x, x + 1, '--c') # dashed cyan
plt.plot(x, x + 2, '-.k') # dashdot black
plt.plot(x, x + 3, ':r');  # dotted red

Estos códigos de color de un solo carácter reflejan las abreviaturas estándar de los sistemas de color RGB (Rojo/Verde/Azul) y CMYK (Cian/Magenta/Amarillo/Negro), comúnmente utilizados para los gráficos digitales en color.

Hay muchos otros argumentos de palabras clave que se pueden utilizar para afinar la apariencia del gráfico; para más detalles, sugiero ver el docstring de la función ``plt.plot()`` utilizando las herramientas de ayuda de IPython.

## Ajustar el gráfico: Límites de los ejes

Matplotlib hace un trabajo decente en la elección de los límites de los ejes por defecto para su parcela, pero a veces es bueno tener un control más fino.
La forma más básica de ajustar los límites de los ejes es utilizar los métodos ``plt.xlim()`` y ``plt.ylim()``:

In [None]:
plt.plot(x, np.sin(x))

In [None]:
plt.plot(x, np.sin(x))

plt.xlim(-1, 11)
plt.ylim(-1.5, 1.5);

Si por alguna razón quieres que cualquiera de los ejes se muestre en sentido inverso, puedes simplemente invertir el orden de los argumentos:

In [None]:
plt.plot(x, np.sin(x))

plt.xlim(10, 0)
plt.ylim(1.2, -1.2);

Un método útil relacionado es ``plt.axis()`` (ten en cuenta aquí la posible confusión entre *e* y *eje* con *i*).
El método ``plt.axis()`` permite establecer los límites ``x`` y ``y`` con una sola llamada, pasando una lista que especifica ``[xmin, xmax, ymin, ymax]``:

In [None]:
plt.plot(x, np.sin(x))
plt.axis([-1, 11, -1.5, 1.5]);

El método ``plt.axis()`` va incluso más allá, permitiéndole hacer cosas como ajustar automáticamente los límites alrededor del gráfico actual:

In [None]:
plt.plot(x, np.sin(x))
plt.axis('tight');

Permite incluso especificaciones de mayor nivel, como garantizar una relación de aspecto igual para que en su pantalla, una unidad en ``x`` sea igual a una unidad en ``y``:

In [None]:
plt.plot(x, np.sin(x))
plt.axis('equal');

Para más información sobre los límites de los ejes y otras capacidades del método ``plt.axis``, consulte el docstring ``plt.axis``.

## Etiquetado de gráficos

Continuamos con el etiquetado de los gráficos: títulos, etiquetas de ejes y leyendas simples.

Los títulos y las etiquetas de los ejes son las etiquetas más sencillas; hay métodos que se pueden utilizar para establecerlas rápidamente:

In [None]:
plt.plot(x, np.sin(x))
plt.title("A sin curve")
plt.xlabel("Valores")
plt.ylabel("y");

**La posición, el tamaño y el estilo de estas etiquetas pueden ajustarse utilizando argumentos opcionales a la función.**
Para más información, consulte la documentación de Matplotlib y los docstrings de cada una de estas funciones.

Cuando se muestran múltiples líneas dentro de un mismo eje, puede ser útil crear una **leyenda del gráfico** que etiquete cada tipo de línea.
Una vez más, **Matplotlib tiene una forma incorporada de crear rápidamente tal leyenda.**
Se hace a través del método (lo has adivinado) ``plt.legend()``.
Aunque hay varias formas válidas de usar esto, me parece más fácil especificar la etiqueta de cada línea usando la palabra clave ``label`` de la función de trazado:

In [None]:
plt.plot(x, np.sin(x), '-g', label = 'sin(x)')
plt.plot(x, np.cos(x), ':b', label = 'cos(x)')
plt.axis('equal')
# plt.grid(False)

plt.legend();

Como puede ver, la función ``plt.legend()`` mantiene un registro del estilo y el color de la línea, y los hace coincidir con la etiqueta correcta.
Puede encontrar más información sobre la especificación y el formato de las leyendas de los gráficos en el docstring ``plt.legend``.

## Aparte: Triquiñuelas Matplotlib 

Mientras que la mayoría de las funciones de ``plt`` se traducen directamente a los métodos de ``ax`` (como ``plt.plot()`` → ``ax.plot()``, ``plt.legend()`` → ``ax.legend()``, etc.), este no es el caso de todos los comandos.
En particular, las funciones para establecer límites, etiquetas y títulos se modifican ligeramente.
**Para la transición entre las funciones de estilo MATLAB y los métodos orientados a objetos, haz los siguientes cambios:**

- ``plt.xlabel()`` → ``ax.set_xlabel()``
- ``plt.ylabel()`` → ``ax.set_ylabel()``
- ``plt.xlim()`` → ``ax.set_xlim()``
- ``plt.ylim()`` → ``ax.set_ylim()``
- ``plt.title()`` → ``ax.set_title()``

En la interfaz orientada a objetos para trazar, en lugar de llamar a estas funciones individualmente, a menudo es más conveniente utilizar el método ``ax.set()`` para establecer todas estas propiedades a la vez:

In [None]:
ax = plt.axes()
ax.plot(x, np.sin(x))
ax.set(xlim=(0, 10), ylim=(-2, 2),
       xlabel='x', ylabel='sin(x)',
       title='A Simple Plot');

# Simple Scatter Plots

Otro tipo de gráfico comúnmente utilizado es el gráfico de dispersión simple, un primo cercano del gráfico de líneas.
En lugar de que los puntos estén unidos por segmentos de línea, aquí los puntos se representan individualmente con un punto, un círculo u otra forma.

## Scatter Plots con ``plt.plot``

En la sección anterior vimos ``plt.plot``/`ax.plot`` para producir gráficos de líneas.
Resulta que esta misma función puede producir gráficos de dispersión también:

In [None]:
x = np.linspace(0, 10, 30)
y = np.sin(x)

plt.plot(x, y, 'o', color='black');

El tercer argumento de la llamada a la función es un carácter que representa el tipo de símbolo utilizado para el trazado. Al igual que se pueden especificar opciones como ``'-'``, ``'--'`` para controlar el estilo de la línea, el estilo del marcador tiene su propio conjunto de códigos de cadena cortos. La lista completa de símbolos disponibles puede verse en la documentación de ``plt.plot``, o en la documentación online de Matplotlib. La mayoría de las posibilidades son bastante intuitivas, y aquí mostraremos algunas de las más comunes:

In [None]:
rng = np.random.RandomState(0)
for marker in ['o', '.', ',', 'x', '+', 'v', '^', '<', '>', 's', 'd']:
    plt.plot(rng.rand(5), rng.rand(5), marker,
             label="marker='{0}'".format(marker))
plt.legend(numpoints=1)
plt.xlim(0, 1.8);

Para obtener aún más posibilidades, estos códigos de caracteres pueden utilizarse junto con los códigos de línea y color para trazar puntos junto con una línea que los conecte:

In [None]:
plt.plot(x, y, '-ok');

Los argumentos adicionales a ``plt.plot`` especifican una amplia gama de propiedades de las líneas y los marcadores:

In [None]:
plt.plot(x, y, '-p',
        color='gray',
        linewidth = 4,
        markersize = 15,
        markerfacecolor = 'white',
        markeredgecolor = 'red',
        markeredgewidth = 2);

Este tipo de flexibilidad en la función ``plt.plot`` permite una amplia variedad de posibles opciones de visualización.
Para una descripción completa de las opciones disponibles, consulte la documentación de ``plt.plot``.

## Scatter Plots con ``plt.scatter``

Un segundo método más potente para crear gráficos de dispersión es la función ``plt.scatter``, que puede utilizarse de forma muy similar a la función ``plt.plot``:

In [None]:
plt.scatter(x, y);

**La principal diferencia entre ``plt.scatter`` y ``plt.plot`` es que puede utilizarse para crear gráficos de dispersión en los que las propiedades de cada punto individual (tamaño, color de la cara, color del borde, etc.) pueden controlarse individualmente o asignarse a los datos.

Vamos a demostrarlo creando un gráfico de dispersión aleatorio con puntos de muchos colores y tamaños.
Para ver mejor los resultados superpuestos, también usaremos la palabra clave ``alpha`` para ajustar el nivel de transparencia:

In [None]:
rng = np.random.RandomState(0)
x = rng.randn(100)
y = rng.randn(100)
colors = rng.rand(100)
sizes = 1000 * rng.rand(100)

plt.scatter(x, y, c=colors, s=sizes, alpha=0.3,
            cmap='viridis')
plt.colorbar();  # show color scale

Observe que el argumento del color se asigna automáticamente a una escala de colores (mostrada aquí por el comando ``colorbar()``), y que el argumento del tamaño se da en píxeles.
De este modo, el color y el tamaño de los puntos pueden utilizarse para transmitir información en la visualización, con el fin de visualizar datos multidimensionales.

Por ejemplo, podemos utilizar los datos de Iris de Scikit-Learn, donde cada muestra es uno de los tres tipos de flores a los que se les ha medido cuidadosamente el tamaño de sus pétalos y sépalos:

In [None]:
from sklearn.datasets import load_iris
iris = load_iris()

In [None]:
iris.feature_names

In [None]:
features = iris.data.T

plt.scatter(features[0], features[2], alpha=0.5,
            s=100*features[3], c=iris.target, cmap='viridis')
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[2])
plt.colorbar();

Podemos ver que este gráfico de dispersión nos ha dado la posibilidad de **explorar simultáneamente cuatro dimensiones diferentes de los datos
la ubicación (x, y) de cada punto corresponde a la longitud y la anchura del sépalo, el tamaño del punto está relacionado con la anchura del pétalo, y el color está relacionado con la especie particular de la flor.
Los gráficos de dispersión multicolor y de múltiples características como éste pueden ser útiles tanto para la exploración como para la presentación de los datos.

## ``plot`` frente al ``scatter``: Una nota sobre la eficiencia

Aparte de las diferentes características disponibles en ``plt.plot`` y ``plt.scatter``, **¿por qué elegir uno en vez de otro?** Aunque no importa mucho para cantidades pequeñas de datos, a medida que los conjuntos de datos superan unos pocos miles de puntos, **``plt.plot`` puede ser notablemente más eficiente que ``plt.scatter``.
La razón es que ``plt.scatter`` tiene la capacidad de renderizar un tamaño y/o color diferente para cada punto, por lo que el renderizador debe hacer el trabajo extra de construir cada punto individualmente.**
En cambio, en ``plt.plot``, los puntos son siempre esencialmente clones unos de otros, por lo que el trabajo de determinar la apariencia de los puntos se realiza sólo una vez para todo el conjunto de datos.
Para grandes conjuntos de datos, la diferencia entre estos dos puede conducir a un rendimiento muy diferente, y por esta razón, ``plt.plot`` debe ser preferido sobre ``plt.scatter`` para grandes conjuntos de datos.

# Personalización de las leyendas de los gráficos

Las leyendas de los gráficos dan sentido a una visualización, asignando un significado a los distintos elementos del gráfico.
Anteriormente vimos cómo crear una leyenda simple; aquí echaremos un vistazo a la personalización de la colocación y la estética de la leyenda en Matplotlib.

La leyenda más sencilla puede crearse con el comando ``plt.legend()``, que crea automáticamente una leyenda para cualquier elemento del gráfico etiquetado:

In [None]:
x = np.linspace(0, 10, 1000)
fig, ax = plt.subplots()
ax.plot(x, np.sin(x), '-b', label='Sine')
ax.plot(x, np.cos(x), '--r', label='Cosine')
ax.axis('equal') # Same scale in x and y
ax.legend();

Pero hay muchas formas en las que podemos querer personalizar dicha leyenda.
Por ejemplo, podemos especificar la ubicación y desactivar el marco:

In [None]:
ax.legend(loc = 'upper left', frameon = False)
fig

Podemos utilizar el comando ``ncol`` para especificar el número de columnas de la leyenda:

In [None]:
ax.legend(loc = 'lower center', frameon = False, ncol = 2)
fig

Podemos utilizar una caja redondeada (``fancybox``) o añadir una sombra, cambiar la transparencia (valor alfa) del marco, o cambiar el relleno alrededor del texto:

In [None]:
ax.legend(fancybox=True, framealpha=0.1, shadow=True, borderpad=1)
fig

Para más información sobre las opciones de leyenda disponibles, consulte el docstring ``plt.legend``.

##  Selección de elementos para la leyenda

Como ya hemos visto, la leyenda incluye por defecto todos los elementos etiquetados.
Si esto no es lo que se desea, podemos afinar qué elementos y etiquetas aparecen en la leyenda utilizando los objetos devueltos por los comandos de trazado.
El comando ``plt.plot()`` es capaz de crear múltiples líneas a la vez, y devuelve una lista de instancias de líneas creadas.
Si pasamos cualquiera de ellas a ``plt.legend()`` le diremos cuáles identificar, junto con las etiquetas que queramos especificar:

In [None]:
y = np.sin(x[:, np.newaxis] + np.pi * np.arange(0, 2, 0.5))
lines = plt.plot(x, y)

# lines is a list of plt.Line2D instances
plt.legend(lines[:2], ['first', 'second']);

En la práctica, suelo encontrar más claro el primer método, aplicando etiquetas a los elementos del gráfico que quieres mostrar en la leyenda:

In [None]:
plt.plot(x, y[:, 0], label='first')
plt.plot(x, y[:, 1], label='second')
plt.plot(x, y[:, 2:])
plt.legend(framealpha=1, frameon=True);

Tenga en cuenta que, por defecto, la leyenda ignora todos los elementos sin un atributo ``label`` establecido.

## Leyenda para el tamaño de los puntos

A veces los valores predeterminados de la leyenda no son suficientes para la visualización dada.
Por ejemplo, tal vez esté utilizando el tamaño de los puntos para marcar ciertas características de los datos, y quiera crear una leyenda que lo refleje.
Este es un ejemplo en el que utilizaremos el tamaño de los puntos para indicar las poblaciones de las ciudades de California.
Queremos una leyenda que especifique la escala de los tamaños de los puntos, y lo lograremos trazando algunos datos etiquetados sin entradas:

In [None]:
import pandas as pd
cities = pd.read_csv('data/california_cities.csv')
cities.head()

In [None]:
# Extract the data we're interested in
lat, lon = cities['latd'], cities['longd']
population, area = cities['population_total'], cities['area_total_km2']

plt.figure(figsize=(20,10))
# Scatter the points, using size and color but no label
plt.scatter(lon, lat, label=None,
            c=np.log10(population), cmap='viridis',
            s=area, linewidth=0, alpha=0.5)

plt.xlabel('longitude')
plt.ylabel('latitude')
plt.colorbar(label='log$_{10}$(population)')
plt.clim(3, 7)

# Here we create a legend:
# we'll plot empty lists with the desired size and label
for area in [100, 300, 500]:
    plt.scatter([], [], c='k', alpha=0.3, s=area,
                label=str(area) + ' km$^2$')
plt.legend(scatterpoints=1, frameon=False, labelspacing=1, title='City Area')

plt.title('California Cities: Area and Population');

La leyenda siempre hará referencia a algún objeto que se encuentre en el gráfico, por lo que si queremos mostrar una forma concreta tenemos que trazarla.
En este caso, los objetos que queremos (círculos grises) no están en el gráfico, así que **los falsificamos trazando listas vacías.**
Observa también que la leyenda sólo muestra los elementos del gráfico que tienen una etiqueta especificada.

Al trazar listas vacías, creamos objetos de trazado etiquetados que son recogidos por la leyenda, y ahora nuestra leyenda nos dice alguna información útil.
**Esta estrategia puede ser útil para crear visualizaciones más sofisticadas.

Por último, ten en cuenta que para **datos geográficos como éste, sería más claro si pudiéramos mostrar los límites del estado** u otros elementos específicos del mapa.
Para esto, una excelente opción de herramienta es el kit de herramientas Basemap de Matplotlib, que exploraremos en Datos geográficos con Basemap.

## Múltiples leyendas

A veces, cuando se diseña un gráfico, se desea añadir múltiples leyendas a los mismos ejes.
Desafortunadamente, Matplotlib no lo hace fácil: a través de la interfaz estándar de ``leyendas``, sólo es posible crear una única leyenda para todo el gráfico.
**Si tratas de crear una segunda leyenda usando ``plt.legend()`` o ``ax.legend()``, simplemente anulará la primera.
Podemos solucionar esto creando un nuevo artista de leyenda desde cero, y luego utilizando el método de nivel inferior ``ax.add_artist()`` para añadir manualmente el segundo artista al gráfico:

In [None]:
fig, ax = plt.subplots()

lines = []
styles = ['-', '--', '-.', ':']
x = np.linspace(0, 10, 1000)

for i in range(4):
    lines += ax.plot(x, np.sin(x - i * np.pi / 2),
                     styles[i], color='black')
ax.axis('equal')

# specify the lines and labels of the first legend
ax.legend(lines[:2], ['line A', 'line B'],
          loc='upper right', frameon=False)

# Create the second legend and add the artist manually.
from matplotlib.legend import Legend
leg = Legend(ax, lines[2:], ['line C', 'line D'],
             loc='lower right', frameon=False)
ax.add_artist(leg);

Este es un vistazo a los objetos artísticos de bajo nivel que componen cualquier gráfico de Matplotlib.
Si examina el código fuente de ``ax.legend()`` (recuerde que puede hacer esto dentro del cuaderno IPython usando ``ax.legend??``) verá que la función simplemente consiste en algo de lógica para crear un artista ``Legend`` adecuado, que luego se guarda en el atributo ``legend_`` y se añade a la figura cuando se dibuja el gráfico.