## Visualizaciones de datos en Python III

## Objetivos:

**1.** Crear diferentes tipos de visualizaciones en `plotly` y personalizarlas de manera amigable. <br />
**2.** Utilizar `ipywidgets` para explorar datos de forma interactiva. <br />
**3.** Crear visualizaciones interactivas en `plotly` con `ipywidgets`.<br> 
**4.** Definir los componentes necesarios para crear un tablero de control. <br> 
**5.** Personalizar tableros de control con gráficos y controles para generar distintas visualizaciones interactivas.

## 1. Librería `plotly`
`Plotly` es una librería interactiva de uso abierto para el lenguaje Python, que soporta más de 40 tipos de visualizaciones únicas. Estas cubren una amplia gama de casos de uso estadístico, financiero, geográfico y científico. Esta librería nos permite crear visualizaciones interactivas que podemos mostrar en Jupyter Notebook, guardar en archivos HTML o utilizar como parte de aplicaciones web construidas con Python utilizando Dash. 

### 1.1. Declarar una figura en `plotly`
#### Declarar una figura como un diccionario
Declarar una figura haciendo uso de una estructura de datos conocida como un diccionario es el primer paso para entender el funcionamiento de `plotly`. Te recomendamos importar el módulo `plotly.io` utilizando el nombre `pio` (su alias más frecuentemente usado), como se muestra a continuación:

In [1]:
import plotly.io as pio
import plotly.graph_objects as go

In [2]:
# Declaramos una figura:
fig = go.Figure(
                # Definimos los datos para crear una figura.
                data = [
                        # Definimos la primera serie de datos de nuestra figura.
                        # Tipo de visualización. En este caso definimos un gráfico de barras.
                        go.Bar(
                                x = [1, 2, 3], # Eje x. En este caso corresponde a los nombres de las categorias del eje.
                                y = [1, 3, 2]  # Eje y. En este caso corresponde a la frecuencia observada para cada categoria.
                              ),

                        # Definimos la segunda serie de datos de nuestra figura.
                        go.Bar(
                                x = [1, 2, 3], 
                                y = [3, 4, 5]
                              )
                       ]
                )
fig.show()

### 1.2. Tipos de visualizaciones

#### Principales tipos de visualizaciones

La siguiente tabla asocia algunos de los métodos del módulo `go` con el respectivo tipo de visualización que genera. 

| <center>Método<center> | <center>Tipo de visualización<center> | 
| :--- | :--- | 
| `Scatter` | Gráfico de línea, dispersión y burbuja |
| `Hist` | Histogramas |
| `Bar` | Gráfico de barras |
| `Waterfall` | Gráfico de cascada |
| `Pie` | Diagrama de torta |
| `Box` | Diagrama de caja |
| `Splom` | Matriz de dispersión  |

#### Gráfico de línea
Para crear un gráfico de línea utilizamos colecciones de objetos llamadas trazos (`traces`). En primer lugar, creamos un objeto figura. Posteriormente, utilizamos el método `add_trace` para agregar un trazo por cada una de las series de datos que queremos mostrar en nuestra figura. Para finalizar, modificaremos el gráfico añadiéndole títulos y leyendas.

In [3]:
# Creamos el objeto figura:
fig = go.Figure()

# Agregamos el primer trazo:
fig.add_trace(
        go.Scatter(
                    x = [2017,2018,2019,2020], # Coordenadas en el eje x.
                    y = [10,20,30,40],         # Coordenadas en el eje y.
                    name = "A"                 # Nombre de la serie.
                  )
            )

# Agregamos el segundo trazo:
fig.add_trace(
        go.Scatter(
                    x = [2017,2018,2019,2020], # Coordenadas en el eje x.
                    y = [32,34,36,38],         # Coordenadas en el eje y.
                    name = "B"                 # Nombre de la serie.
                  )
            )

# Modificamos el estilo del diseño:
fig.update_layout(
        # Definimos el título del gráfico.
        title = "Unidades Vendidas entre 2017 y 2020",
        # Definimos el título del eje x.
        xaxis_title = "Año",
        # Definimos el título del eje y.
        yaxis_title = "Unidades Vendidas",
        # Definimos el título de la leyenda.
        legend_title = "Producto",
        # Agregamos los años como etiquetas del eje x.
        xaxis = dict(
                      tickmode = 'linear', # Modo de las etiquetas.
                      tick0 = 2017,        # Etiqueta de inicio. En este caso, 2017.
                      dtick = 1            # Aumento entre etiquetas. En este caso, 1.
                    )
                )

# Mostramos la figura:
fig.show()

#### Diagrama de caja
A continuación crearemos una diagrama de caja.

In [4]:
# Importamos la librería de números aleatorios:
from random import random

# Declaramos una figura.
fig = go.Figure(
                data = [ 
                    # Tipo de visualización. En este caso definimos un diagrama de caja:
                    go.Box(
                            y = [2*random()-1 for i in range(100)], # Definimos los valores de la serie de datos.
                            name = "Grupo 1",                       # Definimos nombre de la serie de datos.
                            marker_color = 'yellow'                 # Definimos el color del diagrama.
                               ),
                    # Tipo de visualización. En este caso definimos un diagrama de caja.
                    go.Box(
                            y = [2*random()-.5 for i in range(100)], # Definimos los valores de la serie de datos.
                            name = "Grupo 2",                        # Definimos nombre de la serie de datos.
                            marker_color = 'green'                   # Definimos color del diagrama.
                               ) 
                       ],
                # Modificamos el estilo del diseño.
                layout = go.Layout(
                                    title = "Distribución valores",  # Definimos el título del gráfico.
                                    xaxis_title = "Grupos",          # Definimos el título del eje x.
                                    yaxis_title = "Valor"            # Definimos el título del eje y.
                                  )
                )

fig.show()

## 2. Librería `ipywidgets`
`ipywidgets` es una librería de controles HTML interactivos para Jupyter Notebook. Esta librería agrega interactividad a los gráficos y al manejo de datos, al otorgar control a los usuarios por medio de controles. Te recomendamos importar la librería `ipywidgets` utilizando el nombre `widgets` (su alias más frecuentemente usado), como se muestra a continuación.

In [5]:
import ipywidgets as widgets

#### Tabla con los principales tipos de controles

A continuación se presenta una tabla que asocia algunos de los principales métodos del objeto `widgets`, que importamos anteriormente, con su respectivo tipo de control. 


| <center>Método<center> | <center>Tipo de control<center> | 
| :--- | :--- | 
| `IntSlider*` | Control deslizante |
| `IntRangeSlider*` | Control deslizante (selecciona un rango) |
| `IntProgress*` | Barra que muestra el progreso dentro de un total |
| `ToggleButton` | Botón de activación |
| `Checkbox` | Caja de selección |
| `Dropdown` | Lista desplegable |
| `RadioButtons` | Botón para seleccionar entre múltiples opciones |
| `Select` | Cuadro de selección |
| `SelectMultiple` | Cuadro de selección múltiple |
| `SelectionSlider` | Control deslizante de selección entre múltiples opciones |
| `Text` | Cuadro de texto |


*Este método se utiliza para números enteros, para el caso de números decimales reemplazamos `Int` por `Float`. Por ejemplo, el método `IntSlider` para números decimales es `FloatSlider`.

### 2.1. Controles simples

#### Barra deslizante  
A continuación, crearemos una barra deslizante (`slider`) y posteriormente, capturaremos su valor para mostrarlo. En primer lugar, declaramos la barra deslizante. Esta tiene un valor mínimo de 1, un valor máximo de 10 y va de 1 en 1.  

In [6]:
barra_deslizante = widgets.IntSlider(min = 1, max = 10, step = 1)

Luego, capturamos el valor seleccionado de la barra deslizante en la variable `seleccion`.

In [7]:
seleccion = widgets.Output()

Ahora, definimos una función que actualice el valor de la barra deslizante de acuerdo con la `seleccion` y lo muestre en un mensaje. 

In [8]:
def funcion_a_correr_tras_cambio(info_control): 
    # Reestablecemos la variable seleccion.
    seleccion.clear_output()
    # Cuando seleccion toma un nuevo valor.
    with seleccion:
        # Mostramos un mensaje con el valor del control.
        print("La barra deslizante toma un valor de "+ str(info_control['new']))

Posteriormente, vinculamos la barra deslizante con la función definida.

In [9]:
barra_deslizante.observe(funcion_a_correr_tras_cambio, names='value')

Visualicemos la barra deslizante:

In [10]:
display(barra_deslizante)

IntSlider(value=1, max=10, min=1)

Finalmente, verificamos nuestra implementación mostrando el valor de la barra deslizante.

In [11]:
display(seleccion)

Output()

## 3. Librería `panel`

### 3.1. Componentes necesarios
Para comenzar, debemos importar las librerías necesarias para crear tableros de control (*dashboards*). Te recomendamos importar la librería `panel` utilizando el nombre `pn` (su alias más frecuentemente usado), como se muestra a continuación.

In [12]:
import panel as pn
import pandas as pd
import plotly.graph_objects as go

Ahora, declaramos la extensión de `plotly` en `panel`.

In [13]:
pn.extension('plotly')

Luego, importamos la base de datos de los viajes en Citi Bike dentro de Nueva York durante algunos días del mes de enero de 2021 y realizamos una breve exploración de esta.

In [14]:
datos = pd.read_csv('C:\\Users\\andre\\OneDrive\\Escritorio\\202101-citibike-tripdata.csv')
datos = pd.DataFrame(datos)
datos.head()

Unnamed: 0,tripduration,starttime,stoptime,start station id,start station name,start station latitude,start station longitude,end station id,end station name,end station latitude,end station longitude,bikeid,usertype,birth year,gender
0,2513,2021-01-01 00:00:11.9020,2021-01-01 00:42:05.2260,3581,Underhill Ave & Lincoln Pl,40.674012,-73.967146,3581,Underhill Ave & Lincoln Pl,40.674012,-73.967146,47812,Customer,1969,0
1,2519,2021-01-01 00:00:15.0960,2021-01-01 00:42:14.9780,3581,Underhill Ave & Lincoln Pl,40.674012,-73.967146,3581,Underhill Ave & Lincoln Pl,40.674012,-73.967146,47571,Customer,1969,0
2,1207,2021-01-01 00:00:28.9300,2021-01-01 00:20:36.6510,3144,E 81 St & Park Ave,40.776777,-73.95901,3724,7 Ave & Central Park South,40.766741,-73.979069,37451,Subscriber,2002,1
3,2506,2021-01-01 00:00:32.7130,2021-01-01 00:42:19.3980,3581,Underhill Ave & Lincoln Pl,40.674012,-73.967146,3581,Underhill Ave & Lincoln Pl,40.674012,-73.967146,48884,Customer,2002,1
4,959,2021-01-01 00:00:35.3650,2021-01-01 00:16:34.6010,534,Water - Whitehall Plaza,40.702551,-74.012723,332,Cherry St,40.712199,-73.979481,26837,Customer,2002,1


Las variables que utlizaremos se encuentran en la siguiente tabla:

| <center>Variable<center> | <center>Descripción<center> | 
| :--- | :--- | 
| `start station name` | Estación de inicio del viaje |
| `end station name` | Estación de llegada del viaje |
| `bikeid` | Indentificador de la bicicleta |


A continuación, definimos los componentes del tablero de control. Primero, agregamos un título:

In [15]:
titulo = '# Tablero de control Citi Bike'

Segundo, creamos una lista desplegable con las estaciones de salida:

In [16]:
seleccion = pn.widgets.Select(name='Estación de salida', options= datos['start station name'].unique().tolist())

### 3.2. Personalización
A continuación, agregamos funcionalidad al tablero de control:

In [17]:
# Le decimos al panel, que nuestro gráfico depende de cambios en el párametro seleccion.
@pn.depends(seleccion.param.value)

# Definimos la función que se encarga de la interactividad del tablero de control.
def funcion_interactiva(seleccion): 

    # Cargamos los datos.
    df = datos 
    # Creamos un filtro de datos que utiliza valores de la lista desplegable.
    filtro = (df['start station name'] == seleccion) 
    # Filtramos el DataFrame.
    df = df.loc[filtro]
    # Agrupamos los datos por estación de llegada para poder contrarlos.
    df=df.groupby('end station name').count().reset_index()
    # Ordenamos los datos de mayor a menor.
    df.sort_values(by=['bikeid'], inplace=True, ascending=False)
    
    # Definimos y retornamos la figura.
    fig = go.Figure(go.Bar(
                            x=df['bikeid'],
                            y=df["end station name"],
                            text=df['bikeid'],
                            textposition='outside',                                # Posición de la etiqueta de datos. En este caso a la derecha.
                            texttemplate='%{text}',                                # Formato de texto.
                            marker_color='rgb(26, 118, 255)',                      # Color de las barras.
                            orientation='h'                                        # Orientación de las barras. En este caso horizontal.
                          )
                   )
    
                    
    fig.update_layout(
                        barmode='stack',                                           # Tipo de barras. En este caso apiliadas.
                        yaxis_title="Estación de llegada",
                        xaxis_title="Número de viajes",
                        title= 'Rutas populares saliendo de '+ str(seleccion),
                        xaxis=dict(showgrid=False),                                # Ocultamos la cuadrícula de eje x.
                        yaxis=dict(showgrid=False),                                # Ocultamos la cuadrícula de eje y.
                        plot_bgcolor='white',                                      # Modificamos el color del fondo del gráfico.
                        showlegend=False,                                          # Ocultamos la leyenda.
                        yaxis_range=[9.5, -.5]                                     # Mostramos los 10 primeros datos.
                     )
    
    return fig

Declaramos el tablero de control:

In [18]:
tablero_control = pn.Row(pn.Column(titulo, seleccion), funcion_interactiva)

Finalmente, mostramos el tablero de control:

In [24]:
tablero_control.servable()

BokehModel(combine_events=True, render_bundle={'docs_json': {'486c489e-198d-40eb-9ca3-08f3f1d63bd6': {'defs': …

Ahora, mostramos el tablero de control en otra ventana del navegador. Esto lo podemos hacer de las siguientes dos maneras:

In [23]:
tablero_control.show()

Launching server at http://localhost:51438


<panel.io.server.Server at 0x1ab84fffe50>

In [21]:
pn.serve(tablero_control)

Launching server at http://localhost:51372


<panel.io.server.Server at 0x1ab85012950>