# Visualizaciones avanzadas

Vamos a dar un recorrido por algunas de las posibilidades de la librería de visualización [Plotly](https://plotly.com/python/). Recordamos que estos son algunos de los ejemplos, en la documentación puede encontrar mucho más!

Podemos hacer distintos tipos de gráficos, nosotros vamos a abordar los siguientes:<br>
>    - Objeto gráfico 
>    - Gráficos a partir de diccionarios 
>    - Plotly express 

Finalmente veremos una aplicación con [Dash](https://plotly.com/dash/)

### Datos

Vamos a usar un dataset de la Ciudad de Buenos Aires con información acerca de estaciones de subtes.

import pandas as pd 
                                
data = pd.read_csv('https://datasets-humai.s3.amazonaws.com/datasets/data_subtes.csv')

In [2]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3000079 entries, 0 to 3000078
Data columns (total 12 columns):
Unnamed: 0         int64
periodo            int64
fecha              object
desde              object
hasta              object
linea              object
molinete           object
estacion           object
pax_pagos          float64
pax_pases_pagos    float64
pax_franq          float64
total              float64
dtypes: float64(4), int64(2), object(6)
memory usage: 274.7+ MB


In [None]:
data.isna().sum()

In [None]:
data.head()

Vemos que el dataset es muy grande, por lo que nos vamos a quedar con una muestra.

In [None]:
import random

random.seed(7)
df = data.sample(frac=0.25)

In [None]:
df.info()

Ahora sí, vemos que tenemos un dataset sin valores nulos y bien organizado, podemos seguir con los gráficos.


### A partir de un diccionario


In [None]:
import plotly.io as pio

fig = dict({
    "data": [{"type": "bar",
              "x": df['linea'].value_counts().index.tolist(),
              "y": df['linea'].value_counts()
              }],
    "layout": {"title": {"text": "Cantidad de observaciones por linea"}}
})

pio.show(fig)

Dentro del mismo diccionario podemos personalizar nuestro gráfico de manera más detallada. Vemos como agregarle anotaciones y elegimos un tema de diseño.

In [None]:
fig = dict({
    "data": [{"type": "bar",
              "x": df['linea'].value_counts().index.tolist(),
              "y": df['linea'].value_counts()
              }],
    "layout": {"title": {"text": "Cantidad de observaciones por linea"},
               "template":"ggplot2",
               'annotations':[dict(text="Es la más concurrida", x=0, y=180000),
                             dict(text="Es la menos concurrida", x=5, y=80000)],
               'xaxis':{'title':'Lineas','color':'grey'},
               'yaxis':{'title':'Frecuencia','color':'grey'}
              }
})

pio.show(fig)

### Plotly Express

Con plotly express podemos gozar de la calidad gráfica de plotly sin la necesidad de un código muy complejo.

Acomodomamos los formatos de las fechas.

In [None]:
df['desde'] = pd.to_datetime(df['desde'], format = '%H:%M:%S')
df['hasta'] = pd.to_datetime(df['hasta'], format = '%H:%M:%S')

In [None]:
df.hasta = df.hasta.apply(lambda x: x.strftime('%H:%M:%S'))
df.desde = df.desde.apply(lambda x: x.strftime('%H:%M:%S'))

In [None]:
df.fecha = pd.to_datetime(df['fecha'])

In [None]:
df['dia_semana'] = df['fecha'].apply(lambda x: x.day_name())

In [None]:
import plotly.express as px

template = 'ggplot2'

fig = px.histogram(df.sort_values(by='desde'),
                 x='desde', y="total",
                 template=template, title='Total de pasajeros por hora',
                  labels={'desde':'Horario','total':'Cantidad de pasajeros'})

fig.update_xaxes(rangeslider_visible=True)
fig.show()

### Objeto Grafico

Esta clase de plotly nos permite una mayor customización de los graficos. 

In [None]:
import plotly.graph_objects as go

Ahora vemos los histogramas de 3 días distintos para ver como se comportan, suponemos que los días laborales, el subte se usa más.

Lunes

In [None]:
x1 = df.loc[df['dia_semana']=='Monday']['desde']

traza1 = go.Histogram(
    x = x1.sort_values(),
    y = df.loc[df['dia_semana']=='Monday']['total'],
    name = 'Lunes',
    opacity = 0.8,
    xaxis = 'x1',
    yaxis = 'y1',
    marker = go.histogram.Marker(
        color = 'rgb(95, 182, 239)',
    )
)

Viernes

In [None]:
x2 = df.loc[df['dia_semana']=='Friday']['desde']

traza2 = go.Histogram(
    x = x2.sort_values(),
    y = df.loc[df['dia_semana']=='Friday']['total'],
    name = 'Viernes',
    opacity = 0.8,
    xaxis = 'x1',
    yaxis = 'y1',
    marker = go.histogram.Marker(
        color = 'rgb(300, 150, 100)',
    )
)

Sabados

In [None]:
x3 = df.loc[df['dia_semana']=='Saturday']['desde']

traza3 = go.Histogram(
    x = x3.sort_values(),
    y = df.loc[df['dia_semana']=='Saturday']['total'],
    name = 'Sabados',
    opacity = 0.8,
    xaxis = 'x1',
    yaxis = 'y1',
    marker = go.histogram.Marker(
        color = 'rgb(200, 104, 50)',
    )
)

Retocamos la estetica del gráfico.

In [None]:
plantilla = go.Layout(title='Histogramas por día de semana')

Ahora unimos todas las trazas en una figura de Graphing Objects

In [None]:
fig = go.Figure(data=[traza1, traza2, traza3], layout=plantilla)

fig.show()

### Torta 2D (?)

Creamos un objeto gráfico a partir de los datos instanciados en una figura de plotly express.

In [None]:
store = px.sunburst(df,path=['linea', 'estacion'])

traza = go.Sunburst(labels=store['data'][0]['labels'].tolist(),
                            parents=store['data'][0]['parents'].tolist())

fig = go.Figure(data=[traza])

fig.show()

### OHLC

Vamos a utilizar una serie financiera, en especifico la de Apple. 

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/finance-charts-apple.csv')

In [None]:
df.head(5)

Por sus siglas en inglés OHLC es Open High Low Close.

In [None]:
fig = go.Figure(data=go.Ohlc(x=df['Date'],
                open=df['AAPL.Open'],
                high=df['AAPL.High'],
                low=df['AAPL.Low'],
                close=df['AAPL.Close']))


fig.update_layout(
    title='OHLC de Apple',
    yaxis_title='Acción AAPL',
    shapes = [dict(
        x0='2016-12-09', x1='2016-12-09', y0=0, y1=1, xref='x', yref='paper',   #con esta linea de codigo hacemos la linea vertical
        line_width=2)],
    annotations=[dict(
        x='2016-12-09', y=0.60, xref='x', yref='paper',
        showarrow=True, xanchor='right', text='Apple actualizó el software')]    #con esta linea nos encargamos de la anotación
)


fig.show()

## Ejercicio