# Gráficas interactivas con `plotly`

En un [artículo anterior](http://pybonacci.org/2014/08/05/de-matplotlib-a-la-web-con-plotly/) ya vimos como pasar las gráficas creadas con `matplotlib` a `plotly` para obtener cierto nivel de interacción con los datos en la web.
Ahora, lo que vamos a ver es cómo crear gráficas directamente con `plotly`.
Para ello vamos a utilizar:

+ `pandas 0.14.1`, para trabajar con tablas de datos.
+ `plotly 1.2.6`, para crear las gráficas.

Importamos los paquetes de la manera habitual en cada caso.

In [1]:
import pandas as pd
import plotly.plotly as py
from plotly.graph_objs import *

from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
init_notebook_mode(connected=True)

En el caso de Plotly hemos importado además unos objetos `graph_objs` que nos serán de ayuda a la hora de crear las gráficas.
Trabajar con la API de Plotly en Python se resume en trabajar con *listas y diccionarios* de Python. 
Los `graph_objs` de Plotly nos ayudarán a trabajar con estas listas y diccionarios proporcionando ayuda y validando los datos y parámetros introducidos.

Entre los objetos que importamos tenemos los bloques principales de trabajo:

+ **Figure**, diccionario que representa la figura a representar en `plotly`.
+ **Data**, lista para englobar todos los trazos a representar en una gráfica, ya sean tipo *Scatter*, *Heatmap*, *Box*, etc.
+ **Layout**, diccionario que define los detalles de la disposición de la figura.

help(Figure)

help(Data)

help(Layout)

Como vemos, `Figure` y `Layout` son objetos de tipo diccionario y `Data` es un objeto de tipo lista.
En el caso de `Data`, el orden es importante pues determina el orden de composición de los trazos, empezando por el primero objeto en `Data`.
Por ejemplo, representar una línea sobre una barras no produce, normalmente, el mismo resultado que representar unas barras sobre una línea.

En Plotly cada tipo de gráfica tiene su propio objeto (*trace graph object*) como son `Scatter`, `Bar` o `Histogram`.

help(Scatter)

## Ejemplo práctico: aeropuerto de Heathrow

Hecha la presentación de Plotly pasamos a un ejemplo práctico de uso de la herramienta.
Para ello tomaremos datos de [estadísticas de tráfico](http://www.heathrowairport.com/about-us/investor-centre/results-and-performance/traffic-statistics) del aeropuerto de Heathrow, el tercer mayor del mundo por tráfico de pasajeros.

### Datos estadísticos

Los datos son proporcionados en un fichero Excel que podemos importar con Pandas.

In [2]:
pasajeros = pd.io.excel.read_excel('07-Heathrow_Monthly_Traffic_Statistics_(Jan_2005-Jul_2014).xls',
                                   sheetname=0, # tomamos la primera hoja del archivo
                                   header=2, # la cebecera empieza en la fila 3
                                   index_col=0) # empleamos las fechas como indices
pasajeros.head(5)


The `sheetname` keyword is deprecated, use `sheet_name` instead



Unnamed: 0_level_0,Heathrow,Southampton,Glasgow,Aberdeen,Non-London Airports,UK Total
Month,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2005-01-01,5141123,99945,504138,186378,790461,5931584
2005-02-01,4753591,109120,506851,189925,805896,5559487
2005-03-01,5708627,131983,603225,227621,962829,6671456
2005-04-01,5573022,145749,641107,232191,1019047,6592069
2005-05-01,5636621,168971,795732,242493,1207196,6843817


In [3]:
mercancias = pd.io.excel.read_excel('07-Heathrow_Monthly_Traffic_Statistics_(Jan_2005-Jul_2014).xls',
                                    sheetname=5, # tomamos la sexta hoja del archivo
                                    header=2, # la cebecera empieza en la fila 3
                                    index_col=0) # empleamos las fechas como indices
mercancias.head(5)


The `sheetname` keyword is deprecated, use `sheet_name` instead



Unnamed: 0_level_0,Heathrow,Southampton,Glasgow,Aberdeen,Non-London Airports,UK Total
Month,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2005-01-01,98781.175,16.237,491.582,304.274,812.093,99593.268
2005-02-01,99555.454,16.554,545.17,310.282,872.006,100427.46
2005-03-01,109387.896,18.83,578.286,368.156,965.272,110353.168
2005-04-01,108057.553,18.277,569.431,321.004,908.712,108966.265
2005-05-01,110612.691,17.466,661.753,369.324,1048.543,111661.234


Como podemos ver, se trata de una serie temporal.
Y puesto que los datos se proporcionan mes a mes, podríamos deshacernos del día del mes indicandole a Pandas que se trata de un periodo de frecuencia mensual con `to_period`. Pero no es necesario, pues como veremos más adelante, Plotly es capaz de *intuir* que queremos representar los datos mes a mes.

In [4]:
pasajeros.to_period('M').head(2)

Unnamed: 0_level_0,Heathrow,Southampton,Glasgow,Aberdeen,Non-London Airports,UK Total
Month,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2005-01,5141123,99945,504138,186378,790461,5931584
2005-02,4753591,109120,506851,189925,805896,5559487


### Representación gráfica de los datos

Si ya hemos guardado nuestras credenciales de Plotly en el ordenador, al importar el paquete como

    import plotly.plotly as py
    
ya nos *logueamos* automáticamente en el servidor sin tener que acceder mediante

    py.sign_in('username', 'api_key')
    
Una figura (`Figure`) Plotly se compone de los datos a representar (`Data`) y de un formato (`Layout`), y estos a su vez no son más que un conjunto de listas y diccionarios que Plotly se encargará de convertir a un formato [JSON](http://en.wikipedia.org/wiki/Json).
Como hemos mencionado arriba, Plotly proporciona una serie de `graph_objs` que nos facilitarán la tarea de componer gráficas interactivas y que veremos a continuación.

#### Data

Empezamos por el conjunto de datos a representar.
En este caso vamos a representar el tráfico mensual de pasajeros en los aeropuertos británicos del grupo [Heathrow](http://en.wikipedia.org/wiki/Heathrow_Airport_Holdings), participada al 25% por [Ferrovial](http://es.wikipedia.org/wiki/Ferrovial), que incluye los aeropuertos de:

+ London Heathrow Airport
+ Southampton Airport
+ Glasgow Airport
+ Aberdeen Airport

Para representar estos datos nos valdremos de la herramienta `Data` que, como hemos visto anteriormente, admite una lista de objetos. 
En nuestro caso, líneas.
Para ello nos valdremos de `Scatter` (*dispersión*) al cual pasaremos los siguentes parámetros:

+ `name`, nombre que damos a la línea, en nuestro caso, el nombre del aeropuerto.
+ `x`, array con los meses del año que corresponden al *index* de nuestro `DataFrame`.
+ `y`, array con el número de pasajeros correspondientes a cada aeropuerto.
+ `mode`, cadena de texto que indica el tipo de representación que queremos, ya sea `'lines'`, `'markers'`, `'text'` o una combinación de ellos como podría ser `'lines+markers'`.

Puesto que se trata de una lista con cuatro líneas a representar, haremos uso de las [list comprehensions](https://docs.python.org/3.4/tutorial/datastructures.html#list-comprehensions) de Python.

In [5]:
p_data = Data([Scatter(name=col,
                       x=pasajeros.index,
                       y=pasajeros[col],
                       mode='lines') for col in pasajeros.columns.values[:4]])


plotly.graph_objs.Data is deprecated.
Please replace it with a list or tuple of instances of the following types
  - plotly.graph_objs.Scatter
  - plotly.graph_objs.Bar
  - plotly.graph_objs.Area
  - plotly.graph_objs.Histogram
  - etc.




#### Layout

Ya con los datos a representar definidos, ahora podemos pasar a retocar el *layout* de la figura.
Para ello vamos a añadir un título a la gráfica y a los ejes *x* e *y*.
Otra cosa que haremos también es encuadrar la gráfica con 
  
    showline=True, mirror='ticks', linewidth=2

y reducir los margenes derecho `r` y superior `t` para aprovechar mejor el espacio.

In [6]:
p_layout = Layout(title='Tráfico mensual de pasajeros en aeropuertos del grupo Heathrow',
                  xaxis=XAxis(title='Mes', showgrid=False, showline=True, mirror='ticks', linewidth=2),
                  yaxis=YAxis(title='Pasajeros', zeroline=False, showline=True, mirror='ticks', linewidth=2),
                  margin=Margin(r=20, t=80))


plotly.graph_objs.XAxis is deprecated.
Please replace it with one of the following more specific types
  - plotly.graph_objs.layout.XAxis
  - plotly.graph_objs.layout.scene.XAxis



plotly.graph_objs.YAxis is deprecated.
Please replace it with one of the following more specific types
  - plotly.graph_objs.layout.YAxis
  - plotly.graph_objs.layout.scene.YAxis



plotly.graph_objs.Margin is deprecated.
Please replace it with one of the following more specific types
  - plotly.graph_objs.layout.Margin




#### Figure

Una vez ya tenemos los datos y el *layout* podemos pasar a componer la figura y subirla al servidor.

In [10]:
p_fig = Figure(data=p_data, layout=p_layout)
p_plot = iplot(p_fig)

### Diccionarios y listas

Tanto `Figure` como `Layout`, `XAxis`, `YAxis` y `Margin` se podrían substituir por la expresión `dict()` pues, como ya hemos mencionados, Plotly trabaja con diccionarios y listas de Python. Sin embargo, el utilizar estas herramientas de `plotly.graph_objs` nos da acceso a la ayuda, y nos permite validar los parámetros introducidos.

In [8]:
m_data = Data([Scatter(name=col,
                       x=mercancias.index,
                       y=mercancias[col],
                       mode='lines') for col in pasajeros.columns.values[:4]])


plotly.graph_objs.Data is deprecated.
Please replace it with a list or tuple of instances of the following types
  - plotly.graph_objs.Scatter
  - plotly.graph_objs.Bar
  - plotly.graph_objs.Area
  - plotly.graph_objs.Histogram
  - etc.




In [9]:
m_layout = Layout(title='Tráfico mensual de mercancías en aeropuertos del grupo Heathrow',
                  xaxis=XAxis(title='Mes', showgrid=False, showline=True, mirror='ticks', linewidth=2),
                  yaxis=YAxis(title='Mercancías (t)', zeroline=False, showline=True, mirror='ticks', lineheight=2),
                  margin=Margin(r=20, t=80))


plotly.graph_objs.XAxis is deprecated.
Please replace it with one of the following more specific types
  - plotly.graph_objs.layout.XAxis
  - plotly.graph_objs.layout.scene.XAxis



plotly.graph_objs.YAxis is deprecated.
Please replace it with one of the following more specific types
  - plotly.graph_objs.layout.YAxis
  - plotly.graph_objs.layout.scene.YAxis



plotly.graph_objs.Margin is deprecated.
Please replace it with one of the following more specific types
  - plotly.graph_objs.layout.Margin




ValueError: Invalid property specified for object of type plotly.graph_objs.layout.YAxis: 'lineheight'

    Valid properties:
        anchor
            If set to an opposite-letter axis id (e.g. `x2`, `y`),
            this axis is bound to the corresponding opposite-letter
            axis. If set to "free", this axis' position is
            determined by `position`.
        automargin
            Determines whether long tick labels automatically grow
            the figure margins.
        autorange
            Determines whether or not the range of this axis is
            computed in relation to the input data. See `rangemode`
            for more info. If `range` is provided, then `autorange`
            is set to False.
        calendar
            Sets the calendar system to use for `range` and `tick0`
            if this is a date axis. This does not set the calendar
            for interpreting data on this axis, that's specified in
            the trace or via the global `layout.calendar`
        categoryarray
            Sets the order in which categories on this axis appear.
            Only has an effect if `categoryorder` is set to
            "array". Used with `categoryorder`.
        categoryarraysrc
            Sets the source reference on plot.ly for  categoryarray
            .
        categoryorder
            Specifies the ordering logic for the case of
            categorical variables. By default, plotly uses "trace",
            which specifies the order that is present in the data
            supplied. Set `categoryorder` to *category ascending*
            or *category descending* if order should be determined
            by the alphanumerical order of the category names. Set
            `categoryorder` to "array" to derive the ordering from
            the attribute `categoryarray`. If a category is not
            found in the `categoryarray` array, the sorting
            behavior for that attribute will be identical to the
            "trace" mode. The unspecified categories will follow
            the categories in `categoryarray`.
        color
            Sets default for all colors associated with this axis
            all at once: line, font, tick, and grid colors. Grid
            color is lightened by blending this with the plot
            background Individual pieces can override this.
        constrain
            If this axis needs to be compressed (either due to its
            own `scaleanchor` and `scaleratio` or those of the
            other axis), determines how that happens: by increasing
            the "range" (default), or by decreasing the "domain".
        constraintoward
            If this axis needs to be compressed (either due to its
            own `scaleanchor` and `scaleratio` or those of the
            other axis), determines which direction we push the
            originally specified plot area. Options are "left",
            "center" (default), and "right" for x axes, and "top",
            "middle" (default), and "bottom" for y axes.
        domain
            Sets the domain of this axis (in plot fraction).
        dtick
            Sets the step in-between ticks on this axis. Use with
            `tick0`. Must be a positive number, or special strings
            available to "log" and "date" axes. If the axis `type`
            is "log", then ticks are set every 10^(n*dtick) where n
            is the tick number. For example, to set a tick mark at
            1, 10, 100, 1000, ... set dtick to 1. To set tick marks
            at 1, 100, 10000, ... set dtick to 2. To set tick marks
            at 1, 5, 25, 125, 625, 3125, ... set dtick to
            log_10(5), or 0.69897000433. "log" has several special
            values; "L<f>", where `f` is a positive number, gives
            ticks linearly spaced in value (but not position). For
            example `tick0` = 0.1, `dtick` = "L0.5" will put ticks
            at 0.1, 0.6, 1.1, 1.6 etc. To show powers of 10 plus
            small digits between, use "D1" (all digits) or "D2"
            (only 2 and 5). `tick0` is ignored for "D1" and "D2".
            If the axis `type` is "date", then you must convert the
            time to milliseconds. For example, to set the interval
            between ticks to one day, set `dtick` to 86400000.0.
            "date" also has special values "M<n>" gives ticks
            spaced by a number of months. `n` must be a positive
            integer. To set ticks on the 15th of every third month,
            set `tick0` to "2000-01-15" and `dtick` to "M3". To set
            ticks every 4 years, set `dtick` to "M48"
        exponentformat
            Determines a formatting rule for the tick exponents.
            For example, consider the number 1,000,000,000. If
            "none", it appears as 1,000,000,000. If "e", 1e+9. If
            "E", 1E+9. If "power", 1x10^9 (with 9 in a super
            script). If "SI", 1G. If "B", 1B.
        fixedrange
            Determines whether or not this axis is zoom-able. If
            true, then zoom is disabled.
        gridcolor
            Sets the color of the grid lines.
        gridwidth
            Sets the width (in px) of the grid lines.
        hoverformat
            Sets the hover text formatting rule using d3 formatting
            mini-languages which are very similar to those in
            Python. For numbers, see: https://github.com/d3/d3-form
            at/blob/master/README.md#locale_format And for dates
            see: https://github.com/d3/d3-time-
            format/blob/master/README.md#locale_format We add one
            item to d3's date formatter: "%{n}f" for fractional
            seconds with n digits. For example, *2016-10-13
            09:15:23.456* with tickformat "%H~%M~%S.%2f" would
            display "09~15~23.46"
        layer
            Sets the layer on which this axis is displayed. If
            *above traces*, this axis is displayed above all the
            subplot's traces If *below traces*, this axis is
            displayed below all the subplot's traces, but above the
            grid lines. Useful when used together with scatter-like
            traces with `cliponaxis` set to False to show markers
            and/or text nodes above this axis.
        linecolor
            Sets the axis line color.
        linewidth
            Sets the width (in px) of the axis line.
        mirror
            Determines if the axis lines or/and ticks are mirrored
            to the opposite side of the plotting area. If True, the
            axis lines are mirrored. If "ticks", the axis lines and
            ticks are mirrored. If False, mirroring is disable. If
            "all", axis lines are mirrored on all shared-axes
            subplots. If "allticks", axis lines and ticks are
            mirrored on all shared-axes subplots.
        nticks
            Specifies the maximum number of ticks for the
            particular axis. The actual number of ticks will be
            chosen automatically to be less than or equal to
            `nticks`. Has an effect only if `tickmode` is set to
            "auto".
        overlaying
            If set a same-letter axis id, this axis is overlaid on
            top of the corresponding same-letter axis. If False,
            this axis does not overlay any same-letter axes.
        position
            Sets the position of this axis in the plotting space
            (in normalized coordinates). Only has an effect if
            `anchor` is set to "free".
        range
            Sets the range of this axis. If the axis `type` is
            "log", then you must take the log of your desired range
            (e.g. to set the range from 1 to 100, set the range
            from 0 to 2). If the axis `type` is "date", it should
            be date strings, like date data, though Date objects
            and unix milliseconds will be accepted and converted to
            strings. If the axis `type` is "category", it should be
            numbers, using the scale where each category is
            assigned a serial number from zero in the order it
            appears.
        rangemode
            If "normal", the range is computed in relation to the
            extrema of the input data. If *tozero*`, the range
            extends to 0, regardless of the input data If
            "nonnegative", the range is non-negative, regardless of
            the input data. Applies only to linear axes.
        scaleanchor
            If set to another axis id (e.g. `x2`, `y`), the range
            of this axis changes together with the range of the
            corresponding axis such that the scale of pixels per
            unit is in a constant ratio. Both axes are still
            zoomable, but when you zoom one, the other will zoom
            the same amount, keeping a fixed midpoint. `constrain`
            and `constraintoward` determine how we enforce the
            constraint. You can chain these, ie `yaxis:
            {scaleanchor: *x*}, xaxis2: {scaleanchor: *y*}` but you
            can only link axes of the same `type`. The linked axis
            can have the opposite letter (to constrain the aspect
            ratio) or the same letter (to match scales across
            subplots). Loops (`yaxis: {scaleanchor: *x*}, xaxis:
            {scaleanchor: *y*}` or longer) are redundant and the
            last constraint encountered will be ignored to avoid
            possible inconsistent constraints via `scaleratio`.
        scaleratio
            If this axis is linked to another by `scaleanchor`,
            this determines the pixel to unit scale ratio. For
            example, if this value is 10, then every unit on this
            axis spans 10 times the number of pixels as a unit on
            the linked axis. Use this for example to create an
            elevation profile where the vertical scale is
            exaggerated a fixed amount with respect to the
            horizontal.
        separatethousands
            If "true", even 4-digit integers are separated
        showexponent
            If "all", all exponents are shown besides their
            significands. If "first", only the exponent of the
            first tick is shown. If "last", only the exponent of
            the last tick is shown. If "none", no exponents appear.
        showgrid
            Determines whether or not grid lines are drawn. If
            True, the grid lines are drawn at every tick mark.
        showline
            Determines whether or not a line bounding this axis is
            drawn.
        showspikes
            Determines whether or not spikes (aka droplines) are
            drawn for this axis. Note: This only takes affect when
            hovermode = closest
        showticklabels
            Determines whether or not the tick labels are drawn.
        showtickprefix
            If "all", all tick labels are displayed with a prefix.
            If "first", only the first tick is displayed with a
            prefix. If "last", only the last tick is displayed with
            a suffix. If "none", tick prefixes are hidden.
        showticksuffix
            Same as `showtickprefix` but for tick suffixes.
        side
            Determines whether a x (y) axis is positioned at the
            "bottom" ("left") or "top" ("right") of the plotting
            area.
        spikecolor
            Sets the spike color. If undefined, will use the series
            color
        spikedash
            Sets the dash style of lines. Set to a dash type string
            ("solid", "dot", "dash", "longdash", "dashdot", or
            "longdashdot") or a dash length list in px (eg
            "5px,10px,2px,2px").
        spikemode
            Determines the drawing mode for the spike line If
            "toaxis", the line is drawn from the data point to the
            axis the  series is plotted on. If "across", the line
            is drawn across the entire plot area, and supercedes
            "toaxis". If "marker", then a marker dot is drawn on
            the axis the series is plotted on
        spikesnap
            Determines whether spikelines are stuck to the cursor
            or to the closest datapoints.
        spikethickness
            Sets the width (in px) of the zero line.
        tick0
            Sets the placement of the first tick on this axis. Use
            with `dtick`. If the axis `type` is "log", then you
            must take the log of your starting tick (e.g. to set
            the starting tick to 100, set the `tick0` to 2) except
            when `dtick`=*L<f>* (see `dtick` for more info). If the
            axis `type` is "date", it should be a date string, like
            date data. If the axis `type` is "category", it should
            be a number, using the scale where each category is
            assigned a serial number from zero in the order it
            appears.
        tickangle
            Sets the angle of the tick labels with respect to the
            horizontal. For example, a `tickangle` of -90 draws the
            tick labels vertically.
        tickcolor
            Sets the tick color.
        tickfont
            Sets the tick font.
        tickformat
            Sets the tick label formatting rule using d3 formatting
            mini-languages which are very similar to those in
            Python. For numbers, see: https://github.com/d3/d3-form
            at/blob/master/README.md#locale_format And for dates
            see: https://github.com/d3/d3-time-
            format/blob/master/README.md#locale_format We add one
            item to d3's date formatter: "%{n}f" for fractional
            seconds with n digits. For example, *2016-10-13
            09:15:23.456* with tickformat "%H~%M~%S.%2f" would
            display "09~15~23.46"
        tickformatstops
            plotly.graph_objs.layout.yaxis.Tickformatstop instance
            or dict with compatible properties
        ticklen
            Sets the tick length (in px).
        tickmode
            Sets the tick mode for this axis. If "auto", the number
            of ticks is set via `nticks`. If "linear", the
            placement of the ticks is determined by a starting
            position `tick0` and a tick step `dtick` ("linear" is
            the default value if `tick0` and `dtick` are provided).
            If "array", the placement of the ticks is set via
            `tickvals` and the tick text is `ticktext`. ("array" is
            the default value if `tickvals` is provided).
        tickprefix
            Sets a tick label prefix.
        ticks
            Determines whether ticks are drawn or not. If **, this
            axis' ticks are not drawn. If "outside" ("inside"),
            this axis' are drawn outside (inside) the axis lines.
        ticksuffix
            Sets a tick label suffix.
        ticktext
            Sets the text displayed at the ticks position via
            `tickvals`. Only has an effect if `tickmode` is set to
            "array". Used with `tickvals`.
        ticktextsrc
            Sets the source reference on plot.ly for  ticktext .
        tickvals
            Sets the values at which ticks on this axis appear.
            Only has an effect if `tickmode` is set to "array".
            Used with `ticktext`.
        tickvalssrc
            Sets the source reference on plot.ly for  tickvals .
        tickwidth
            Sets the tick width (in px).
        title
            Sets the title of this axis.
        titlefont
            Sets this axis' title font.
        type
            Sets the axis type. By default, plotly attempts to
            determined the axis type by looking into the data of
            the traces that referenced the axis in question.
        visible
            A single toggle to hide the axis while preserving
            interaction like dragging. Default is true when a
            cheater plot is present on the axis, otherwise false
        zeroline
            Determines whether or not a line is drawn at along the
            0 value of this axis. If True, the zero line is drawn
            on top of the grid lines.
        zerolinecolor
            Sets the line color of the zero line.
        zerolinewidth
            Sets the width (in px) of the zero line.
        

Si hubiesemos hecho lo mismo con `dict()`, el error hubiese pasado desapercibido hasta el final.

In [None]:
m_layout = dict(title='Tráfico mensual de mercancías en aeropuertos del grupo Heathrow',
                xaxis=dict(title='Mes', showgrid=False, showline=True, mirror='ticks', linewidth=2),
                yaxis=dict(title='Mercancías (t)', zeroline=False, showline=True, mirror='ticks', linewidth=2),
                margin=dict(r=20, t=80))

In [None]:
m_fig = Figure(data=m_data, layout=m_layout)
m_plot = py.iplot(m_fig, filename='pybonacci/heathrow-mercancias')

### Interpretación de los datos

Disponemos de una muestra lo suficientemente grande como desaprovechar la oportunidad de extraer alguna conclusión al respecto.
Y contamos con la ventaja de poder hacer zoom en los datos, lo cual resulta especialmente útil en le tráfico de mercancías, donde el aeropuerto de Heathrow está varios órdenes de magnitud por encima del resto.

#### Pasajeros

Vemos claramente que en los meses de verano hay un aumento del número de pasajeros en todos los aeropuertos del grupo.
También se aprecia un ligero repunte en el mes de diciembre con motivo, previsiblemente, de las vacaciones de navidad.
Esto lo podemos visualizar de otra manera mediante un `Heatmap` del aeropuerto de Heathrow.

Para ello vamos a utilizar el paquete `calendar` que nos permitirá crear una lista con los nombres de los meses; y Numpy para crear una lista con los años.

In [None]:
import calendar
import numpy as np

Para representar el `Heatmap` necesitaremos agrupar los datos por años o meses, en función del eje *y* que tomemos.
En este caso hemos decido representar los meses en el eje de ordenadas, por lo tanto agruparemos los datos por meses.
Para ello nos valdremos de una [función anónima](https://docs.python.org/3.4/reference/expressions.html#lambda).

In [None]:
gb = lambda x: x.month

In [None]:
data = Data([Heatmap(x=np.arange(2005,2015),
                     y=calendar.month_abbr[1:],
                     z=[grp['Heathrow'] for key, grp in pasajeros.groupby(gb)],
                     colorscale='Portland')])

En el eje *x* hemos colocado los años, en el eje *y* los meses, y la intensidad del color viene determinada por el número de pasajeros.

Con `Layout` añadimos el título de la gráfica y los nombres de los ejes, y también podemos especificar el tamaño de la gráfica deshabilitando el `autosize` y definiendo nuestro propio ancho y alto.

In [None]:
layout = Layout(title='Tráfico de pasajeros en el aeropuerto de Heathrow',
                autosize=False,
                width=550,
                height=550,
                xaxis=XAxis(title='Año', showgrid=False),
                yaxis=YAxis(title='Mes', showgrid=False))

Ya podemos publicar nuestra gráfica de la manera habitual.

In [None]:
heatmap_plot = py.iplot(Figure(data=data,layout=layout), filename='pybonacci/heathrow-heatmap')

#### Mercancías

Si en el transporte de pasajeros hay un patrón claro, el transporte de mercancías por avión no muestra signos de estacionalidad.
Para verlo mejor podríamos volver a emplear un `Heatmap`, pero vamos a hacerlo con un [diagrama de caja](http://es.wikipedia.org/wiki/Diagrama_de_caja) `Box` para el aeropuerto de Heathrow.

Aprovecharemos nuevamente la agrupación por meses que hemos empleado para el `Heatmap` de pasajeros. Nuevamente hacemos uso de las list comprehensions de Python para crear una lista de bloques, cada uno correspondiente a un mes. Lo mismo podríamos conseguirlo sin crear una lista y sin necesidad de agrupar si en vez de asignar un `name` asignamos un único array `x` con el valor del mes correspondiente a cada `y`. Con `boxpoints='all'` lo que hacemos es mostrar los puntos de la muestra al lado de cada bloque.

In [None]:
data = Data([Box(name=calendar.month_abbr[key],
                 y=grp['Heathrow'].values,
                 boxpoints='all') for key, grp in mercancias.groupby(gb)])

Añadimos, como es costumbre, un título a la gráfica y aprovechamos para ocultar la leyenda y ajustar los margenes.

In [None]:
layout = Layout(title='Tráfico de mercancías en el aeropuerto de Heathrow (2005-2014)',
                showlegend=False,
                margin=Margin(r=20, t=90))

In [None]:
box_plot = py.iplot(Figure(data=data, layout=layout), filename='pybonacci/heathrow-box')

#### Pasajeros vs mercancías

Hasta ahora hemos visto por separado los datos de pasajeros y mercancías. Compararemos en una única gráfica los datos del aeropuerto de Glasgow. Para facilitar la visualización y compensar la diferencia de magnitud utilizaremos múltiples ejes y, de paso, emplearemos diferentes representaciones para el tráfico de pasajeros y el de mercancías.

Los pasajeros los representaremos mediante líneas y puntos `'lines+markers'` y le asignamos el segundo eje *y* `'y2'`, pues vamos a querer que nos lo represente por encima de las barras de tráfico de mercancías. 
El orden en Plotly es importante.
Vamos a representar las lineas de color dorado primero como horizontales y luego verticales de un valor a otro con `shape='hv'`.
Los puntos serán de un color dorado más claro con el borde también dorado.

In [None]:
pas = Scatter(name='Pasajeros',
              x=pasajeros.index,
              y=pasajeros['Glasgow'],
              yaxis='y2',
              mode='lines+markers',
              line=Line(shape='hv', color='darkgoldenrod'),
              marker=Marker(color='goldenrod',
                            line=Line(color='darkgoldenrod', width=2)))

Por su parte, el tráfico de mercancías lo representaremos como barras verticales de color gris claro. Por defecto se le asigna el primer eje *y*.

In [None]:
mer = Bar(name='Mercancías',
          x=pasajeros.index,
          y=mercancias['Glasgow'],
          marker=Marker(color='lightgray'))

Creamos la lista con los elementos a representar.

In [None]:
data = Data([mer, pas])

Por último configuramos el *layout* añadiendo un título a la gráfica y configurando los ejes.

In [None]:
layout = Layout(title='Tráfico de pasajeros y mercancías en el aeropuerto de Glasgow',
                showlegend=False,
                xaxis=XAxis(title='Mes'),
                yaxis=YAxis(title='Mercancías (t)',
                            showgrid=False),
                yaxis2=YAxis(title='Pasajeros',
                             showgrid=False,
                             overlaying='y',
                             side='right'))

Incluimos también una nota de texto indicando la fuente de los datos.
Plotly nos permite untilizar un subconjunto de etiquetas HTML para dar formato a los textos para por ejemplo incluir nuevas líneas (`<br>`) o añadir hipervínculos (`<a href='...'></a>`) que podremos utilizar en cualquier texto de la gráfica (títulos y anotaciones).

In [None]:
fuente = Annotation(text="Fuente: <a href=\
                          'http://www.heathrowairport.com/about-us/investor-centre/results-and-performance/traffic-statistics'\
                          >LHR Airports Limited</a>",
                    xref='paper', # empleamos coordenadas 'paper', con ello la nota no se moverá al mover los ejes.
                    yref='paper',
                    x=0,
                    y=-0.15,
                    showarrow=False)

Actualizamos el diccionario de *layout* de la gráfica.

In [None]:
layout.update(annotations=Annotations([fuente]))

In [None]:
ma_plot = py.iplot(Figure(data=data, layout=layout), filename='pybonacci/heathrow-multipleaxis')

## Mucho más

Aquí sólo hemos mostrado una pequeña parte del potencial de Plotly.
Todo aquel que quiere ampliar detalles encontrará mucha más información en el [API library](https://plot.ly/python/) de Plotly.
También se pueden sacar buenas ideas del [graphing news feed](https://plot.ly/) viendo lo que publican otros usuarios.

No dudeis en contactar con nosotros o el equipo de Plotly por [email](mailto:feedback@plot.ly) o [Twitter](https://twitter.com/plotlygraphs) para cualquier duda o sugerencia.