# Dibujar con Plotly

In [1]:
import chart_studio.plotly as py
import plotly.tools as tls
import plotly.graph_objs as go

py.sign_in(username='carlosdavila91', api_key='sjP3SuTsus8qjId74CQx')

Siempre que queramos consultar dudas sobre cualquier paquete de python tendremos que haber revisado la versión del paquete y la ayuda. Lo podemos hacer de la siguiente forma.

In [5]:
import plotly
plotly.__version__

'4.1.0'

In [6]:
help(plotly)

Help on package plotly:

NAME
    plotly - https://plot.ly/python/

DESCRIPTION
    Plotly's Python API allows users to programmatically access Plotly's
    server resources.
    
    This package is organized as follows:
    
    Subpackages:
    
    - plotly: all functionality that requires access to Plotly's servers
    
    - graph_objs: objects for designing figures and visualizing data
    
    - matplotlylib: tools to convert matplotlib figures
    
    Modules:
    
    - tools: some helpful tools that do not require access to Plotly's servers
    
    - utils: functions that you probably won't need, but that subpackages use
    
    - version: holds the current API version
    
    - exceptions: defines our custom exception classes

PACKAGE CONTENTS
    _docstring_gen
    _version
    _widget_version
    animation
    basedatatypes
    basewidget
    callbacks
    colors
    config
    dashboard_objs
    data (package)
    exceptions
    express (package)
    figure_factory (

## Scatter plots sencillos

In [2]:
import numpy as np

N = 2000
random_x = np.random.randn(N)
random_y = np.random.randn(N)

Primero creamos la traza (nombre acuñado por los desarrolladores de plotly) con el tipo de gráfico que queremos hacer.

In [8]:
trace = go.Scatter(x=random_x, y=random_y, mode='markers')

Ahora le pedimos que dibuje, con los datos en modo array para que se lo trague la función.

In [9]:
py.iplot([trace], filname='basic-scatter')

Podemos crear el plot para que se abra como una url y editarlo en linea.

In [10]:
plot_url = py.plot([trace], filename='basic-scatter-inline')
plot_url

'https://plot.ly/~carlosdavila91/49/'

## Gráficos combinados

A veces nos intereserá combinar scatter plots con líneas, por ejemplo. Veamos un ejemplo de como se hace con `plotly`.

In [3]:
N = 200
rand_x = np.linspace(0,1, N)
rand_y0 = np.random.randn(N) + 3
rand_y1 = np.random.randn(N)
rand_y2 = np.random.randn(N) - 3

In [4]:
trace0=go.Scatter(x=rand_x, y=rand_y0, mode='markers', name='Puntos')
trace1=go.Scatter(x=rand_x, y=rand_y1, mode='lines', name='Líneas')
trace2=go.Scatter(x=rand_x, y=rand_y2, mode='lines+markers', name='Puntos y líneas')
data=[trace0,trace1,trace2]

In [5]:
py.iplot(data,filename='scatter-line-plot')

## Estilizado de gráficos con plotly

In [8]:
trace = go.Scatter(x=random_x, y=random_y, name='Puntos con estilo guay', mode='markers',
                  marker=dict(size=12, color='rgba(140,20,20,0.8)',line=dict(width=2,color='rgb(10,10,10)')))

layout=dict(title='Scatter Plot Estilizado',xaxis=dict(zeroline=False), yaxis=dict(zeroline=False))

fig=dict(data=[trace],layout=layout)
py.iplot(fig)

In [9]:
trace = go.Scatter(x=random_x, y=random_y, name='Puntos con estilo guay', mode='markers',
                  marker=dict(size=8, color='rgba(10,80,220,0.25)',line=dict(width=2,color='rgb(10,10,80)')))

fig=dict(data=[trace],layout=layout)
py.iplot(fig)

### Histograma

Para revertir la apariencia en la versión 4 de plotly a la versión 3 (presentación más limpia, en mi opinión) habrá que establecer el `template` a `none`. Otros ejemplos de plantillas de estilo se pueden encontrar en la [documentación de plotly](https://plot.ly/python/templates/).

In [29]:
pio.templates

Templates configuration
-----------------------
    Default template: 'none'
    Available templates:
        ['ggplot2', 'seaborn', 'plotly', 'plotly_white', 'plotly_dark',
         'presentation', 'xgridoff', 'none']

In [27]:
import plotly.io as pio
pio.templates.default = "none" 

trace = go.Histogram(x=random_x, name='Histograma con estilo guay', 
                     marker=dict(line=dict(width=2,color='rgb(25,80,0)'),color='rgba(25,80,0,0.5)'))

layout=dict(title='Histograma Estilizado',xaxis=dict(zeroline=False), yaxis=dict(zeroline=True), 
            paper_bgcolor='rgba(0,0,0,0)', plot_bgcolor='rgba(0,0,0,0)') 

fig=dict(data=[trace],layout=layout)
py.iplot(fig)

In [40]:
pio.templates.default = 'plotly_dark'

trace = go.Box(x=random_x,fillcolor='rgba(180,25,95,0.6)', name='', 
               marker=dict(outliercolor='rgb(1,1,1)', line=dict(width=3,color='darkred')))
layout=dict(title='Boxplot Estilizado',xaxis=dict(zeroline=False), yaxis=dict(zeroline=True)) 

fig=dict(data=[trace],layout=layout)
py.iplot(fig)

## Información al hacer Hover

Para ilustrar este apartado usaremos los datos de población de los estados de EEUU.

In [41]:
import pandas as pd
data = pd.read_csv("../../../GitHub/python-ml-course/datasets/usa-population/usa_states_population.csv")
data.head()

Unnamed: 0,Rank,State,Postal,Population
0,1,Alabama,AL,4849377.0
1,2,Alaska,AK,736732.0
2,3,Arizona,AZ,6731484.0
3,4,Arkansas,AR,2966369.0
4,5,California,CA,38802500.0


Usaremos la función `hsl` para colorar el gráfico.

In [45]:
N = 53
c = ['hsl('+str(h)+',50%,50%)' for h in np.linspace(0,360,N)]

In [51]:
l = []
y = []

for i in range(int(N)):
    y.append(2000+i)
    trace0 = go.Scatter(
        x=data['Rank'],
        y=data['Population']+i*1e6,
        mode='markers',
        marker=dict(size=14, line=dict(width=1), color=c[i], opacity=0.3),
        name=str(data['State'])
    )
    l.append(trace0)

In [55]:
layout = go.Layout(title="Población de los Estados de USA",
                  hovermode="closest",
                  xaxis=dict(title="ID",ticklen=5,zeroline=False, gridwidth=2),
                  yaxis=dict(title="Población", ticklen=5,gridwidth=2),
                  showlegend=False)

In [56]:
pio.templates.default = 'plotly_white'

fig = go.Figure(data=l, layout=layout)
py.iplot(fig)

Otra buena opción es usar `colorscale` para colorear en base a valores.

In [57]:
trace = go.Scatter(y=np.random.randn(1000),
                  mode='markers',marker=dict(size=16,color=np.random.randn(1000),
                                            colorscale='Viridis', showscale=True))

py.iplot([trace])

## Datasets muy grandes

Para Data Sets muy grandes `plotly` tiene una alternativa basada en el uso de tecnología web `gl`, la cual se suele usar para mejorar la velocidad de interactuación y poder pintar muchos datos.

In [59]:
N = int(1e5)
trace = go.Scattergl(x=np.random.randn(N), y=np.random.randn(N),mode='markers',
                    marker=dict(color='#BAD5FF', line=dict(width=1)))

In [60]:
py.iplot([trace])

PlotlyRequestError: This file is too big! Your current subscription is limited to 524.288 KB uploads. For more information, please visit: https://go.plot.ly/get-pricing.