# Clase 12: Visualizacion de Datos


**MDS7202: Laboratorio de Programaci√≥n Cient√≠fica para Ciencia de Datos**

**Profesor: Pablo Badilla**

Clase Basada en el Post [**The Art and Science of Data Visualization**](https://towardsdatascience.com/the-art-and-science-of-data-visualization-6f9d706d673e) de [Michael Mahoney](https://medium.com/@mike.mahoney.218)

## Objetivos de la Clase

1. Introducirlos a las visualizaciones de datos y sus principios. 
2. Entregar ejemplos de visualizaciones.
3. Introducirlos al uso de `plotly` para generar gr√°ficos interactivos.

## Visualizaci√≥n de Datos


La visualizaci√≥n de datos es un area dedicada a representar gr√°ficamente los datos con el objetivo de poder comunicar informaci√≥n de forma eficiente y sencilla.


En terminos pr√°cticos, es una funci√≥n que mapea los datos a un gr√°fico. El mapeo determina entre otras cosas: 
    
- Elementos visuales que se mostrar√°n.
- Posici√≥n de los elementos.
- Color de los elementos
- Forma y tama√±o de los elementos.



El tipo de mapeo que creemos determinar√° que tan entendible el gr√°fico ser√°. Por ende, **es de suma importancia crear buenos mapeos**. 

Un gr√°fico "bonito/est√©tico" est√° mucho m√°s all√° de formalidades matem√°ticas. Por ende, la visualizaci√≥n de datos es considerada tanto una ciencia como tambi√©n un arte.

Si bien, la librer√≠a "por defecto" de graficado en python es `Matplotlib`, en este curso usaremos `plotly` como librer√≠a para generar las visualizaciones debido principalmente a sus interfaces y su interactividad.

### Los Principios

Seg√∫n *The Art and Science of Data Visualization*, una buena visualizaci√≥n debe cumplir los siguientes principios:


1. **Un buen gr√°fico cuenta una historia.**

2. **Todo debe ser hecho de la forma m√°s sencilla posible, pero no debe ser simple.**

3. **Se debe usar la herramienta correcta para el trabajo a resolver.**

4. **La tinta es barata, los electrones a√∫n m√°s.**



> Nota: Lo simple es llano, f√°cil, falto de profundidad. Lo sencillo es certero, esencial, preciso, sobrio, escueto, claro y puede tambi√©n ser modesto. Fuente: [Diferencia entre simple y sencillo](https://elpais.com/elpais/2020/01/14/del_tirador_a_la_ciudad/1579025106_976460.html).


Cada uno de estos los veremos a continuaci√≥n

## Pinguinos üêß


**Palmer Archipelago (Antarctica) penguin data**: 


*Data were collected and made available by Dr. Kristen Gorman and the Palmer Station, Antarctica LTER, a member of the Long Term Ecological Research Network.*

https://github.com/allisonhorst/palmerpenguins

![Pinguinos](https://raw.githubusercontent.com/allisonhorst/palmerpenguins/master/man/figures/lter_penguins.png)


    
    
    

### Atributos
 
- `culmen_length_mm`: Largo del culmen (v√©rtice o borde superior de la mand√≠bula)  (mm).
- `culmen_depth_mm`: Alto del culmen (v√©rtice o borde superior de la mand√≠bula) (mm).
- `flipper_length_mm`: Longitud de las aletas (mm).
- `body_mass_g`: Masa corporal (g).
- `island`: Isla de origen (Dream, Torgersen, or Biscoe) en el archipi√©lago de Palmer (Antarctica).
- `sex`: Sexo del pinguino.
- `species`: Especie del pinguino (Chinstrap, Ad√©lie, or Gentoo)
    
![Detalle Variables](https://allisonhorst.github.io/palmerpenguins/reference/figures/culmen_depth.png)
    
<center>Cr√©ditos a Allison Horst por sus excelentes ilustraciones https://github.com/allisonhorst </center>    
    


In [None]:
import pandas as pd

df = pd.read_csv(
    "https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/12-Visualizaciones/penguins.csv"
)
df = df.dropna()
df


---

## 1.- Un Buen Gr√°fico Cuenta Una Historia


Cuando construimos un gr√°fico, es importante entender para que lo estamos construyendo.
Para esto, es preciso pensar por qu√© y para qu√© lo estamos creando.




### ¬øPor qu√© creamos los gr√°ficos?

Comunmente puede caer en dos categor√≠as: 

1. **Gr√°ficos exploratorios**, los cuales se enfocan en identificar patrones en los datos.
2. **Gr√°ficos explicativos**, los cuales se enfocan en explicar los patrones encontrados en los datos.

In [None]:
import plotly.express as px

#### Gr√°ficos Exploratorios

Los gr√°ficos exploratorios son comunmente gr√°ficos muy simples de nuestros datos. Su objetivo es **identificar patrones y c√≥mo ocurren en nuestros datos**.


> **Pregunta ‚ùì**: ¬øDado el datasets de los pinguinos, que ser√≠a interesante explorar?

In [None]:
df.head()


Tomemos por ejemplo, el siguiente gr√°fico de dispersi√≥n en donde relacionamos el largo de la aleta con la masa corporal:

In [None]:
px.scatter(
    df,
    x="flipper_length_mm",
    y="body_mass_g",
)


Para este caso, podemos observar claramente que existe un patr√≥n entre ambas variables: a medida que `flipper_lenght_mm` aumenta, tambi√©n lo hace `body_mass_g`. 

**El objetivo final (para nosotros) de esta visualizaci√≥n ser√≠a entonces entender c√≥mo es esta relaci√≥n.**

En el siguiente ejemplo se muestra la relaci√≥n entre el largo y profundidad del culmen:

In [None]:
px.scatter(
    df,
    x="culmen_length_mm",
    y="culmen_depth_mm",
)


A diferencia del gr√°fico anterior, en esta figura no podemos inferir ninguna relaci√≥n a simple vista.

#### Gr√°ficos Explicativos

Este tipo de gr√°ficos intenta inlcuir **explicaciones del por qu√© suceden los patrones**.

In [None]:
fig = px.scatter(
    df,
    x="flipper_length_mm",
    y="body_mass_g",
    trendline="ols",
    title=(
        "Relaci√≥n entre la masa corporal y el largo de la aleta de "
        "los Pinguinos"
        "<br><sup>Se muestra una la existencia de una relaci√≥n lineal "
        "entre ambas variables a trav√©s de una regresi√≥n lineal con "
        "un buen ajuste (R¬≤ = 0.759).</sup></br>"
    ),
)
fig.show()

> **Pregunta ‚ùì**: Entonces, cu√°l es la diferencia entre el gr√°fico exploratorio y el explicativo?

Noten que la diferencia entre el gr√°fico exploratorio y el explicativo no es lo pulido que es este, si no que en este caso se intenta incluir una explicaci√≥n a los patrones detectados.

### ¬øC√≥mo contamos la Historia?

Obviamente existe una infinidad de posibles combinaciones de gr√°ficos y sus elementos para representar visualmente un objeto. La idea es que podamos seleccionar la mejor.
Podemos utilizar para esto dos criterios:


1. **Expresividad:** Un conjunto de hechos es expresable en un lenguaje visual si las visualizaciones en el lenguaje expresan todos los hechos del conjunto de datos y s√≥lo los hechos de los datos. 

2. **Eficacia:** Una visualizaci√≥n es m√°s eficaz que otra si la informaci√≥n transmitida por una visualizaci√≥n se percibe m√°s f√°cilmente que la informaci√≥n de la otra visualizaci√≥n.


...que en t√©rminos m√°s sencillos se podr√≠an traducir en: 

1. **Solo decir la verdad y nada m√°s que la verdad (no se debe mentir ni tampoco mentir por omisi√≥n)**
2. **Utilizar solo los elementos que la gente pueda entender mejor (donde mejor = m√°s r√°pido y/o m√°s preciso).**



---

## 2.- Todo debe ser hecho de la forma m√°s sencilla posible, pero no debe ser simple

El gr√°fico m√°s simple es el gr√°fico de dispersi√≥n en 2 dimensiones, el cu√°l representa en 2D un par de variables de nuestro dataset.

In [None]:
px.scatter(df, x="flipper_length_mm", y="body_mass_g")

En esta figura, tanto el eje X (largo de la aleta) como el eje Y (masa) tiene una escala y cada punto recae sobre una combinaci√≥n de una posici√≥n en los ejes. Esta es toda la informaci√≥n que podemos representar hasta el momento.

> **Pregunta ?**: ¬øCu√°l es el problema de este tipo de gr√°ficos?

> **Pregunta ?**: Entonces, ¬øC√≥mo podr√≠amos visualizar m√°s variables?

In [None]:
df.head()

Una posible soluci√≥n ser√≠a agregar m√°s dimensiones a nuestra visualizaci√≥n:

In [None]:
px.scatter_3d(df, x="flipper_length_mm", y="body_mass_g", z="island")

> **Pregunta ‚ùì**: ¬øCu√°l es el problema de los gr√°ficos en 3D? ¬øC√≥mo podr√≠amos seguir agregando variables?

Sin emabrgo, esto puede provocar que incremente la dificultad para comprender lo que se comunica, sobre todo si se representa una variable con mayor desorden:

In [None]:
px.scatter_3d(df, x="flipper_length_mm", y="body_mass_g", z="culmen_length_mm")

Y el mayor problema: No podemos agregar otra dimensi√≥n mas.


> **Pregunta ‚ùì**: Entonces, nuevamente viene la pregunta: ¬øC√≥mo podemos visualizar m√°s variables?

### Aesthetics o Par√°metros de la Figura

> *Est√©tica seg√∫n wikipedia: La est√©tica es la rama de la filosof√≠a que estudia la esencia y la percepci√≥n de la belleza y el arte.*


No solo disponemos de la posici√≥n de los puntos sobre sus ejes para poder representar m√°s de dos variables datos, si no que adem√°s contamos con elementos extra como: 




 1. Posici√≥n
 2. Color
 3. Forma
 4. Tama√±o 
 
Cada uno de estos par√°metros y sus combinaciones nos permitir√°n agregar nuevas variables a nuestros gr√°ficos. 

### 1. Posici√≥n

La distancia entre los valores del eje X o Y representa que tan larga la variable es. La gente tiene a considerar que mientras mas lejos est√° un punto, m√°s grande y extremo es su valor. Veamos esto a trav√©s de un sencillo ejemplo en donde generamos un punto que est√° fuera de los patrones:

In [None]:
# solo como ejemplo, modificaremos una medici√≥n de peso a 500
df_ = df.copy()
df_.loc[343, "flipper_length_mm"] = 240
df_.loc[343, "body_mass_g"] = 6650

px.scatter(
    df_,
    x="flipper_length_mm",
    y="body_mass_g",
)

Si vien, se ve a simple vista que este punto est√° fuera de lo esperado, puede en terminos pr√°cticos, no sea realmente as√≠. Para mostrar esto, crearemos el mismo gr√°fico con el eje X partiendo desde 0.

In [None]:
px.scatter(df_, x="flipper_length_mm", y="body_mass_g", range_x=(0, 300), range_y=(0, 6500))

Aqu√≠ pueden notar que en la pr√°ctica, no est√° tan lejos como pensabamos en un inicio respecto al 0. 



Otro ejemplo para gr√°ficos con variables categ√≥ricas.


<br>
<div align='center'/>

<img src='https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/12-Visualizaciones/grafico_charcha.jpg' />
</div>

> **Pregunta ‚ùì**: ¬øQu√© hay de malo con este gr√°fico?

In [None]:
import plotly.graph_objects as go

fig = go.Figure(
    data=[
        go.Bar(
            x=[2010, 2013, 2016],
            y=[30.7, 22.8, 27.3],
            marker_color=["red", "blue", "red"],
        )
    ]
)
fig.show()

In [None]:
fig.update_yaxes(range=[20, 32])
fig.show()

La moraleja de esta secci√≥n es que es com√∫n que se asuma que los gr√°ficos parten siempre desde 0, aunque esto no sea siempre as√≠. Siempre hay que tener esto en mente al momento de dise√±ar las visualizaciones

#### Para Concluir

La moraleja de esta secci√≥n es que al momento de dise√±ar una visualizaci√≥n se debe tener en cuenta el rango/escala de las variables que se est√°n graficando. Una escala distinta puede llevar a gr√°ficos con interpretaciones totalmente distintas.

### Color


Si bien, la secci√≥n anterior nos dio una gran idea de lo cuidadosos que hay que ser al tratar con los ejes y la posici√≥n de los datos, a√∫n no sabemos como incluir una nueva variable dentro de las visualizaciones.

**Spoiler**: Podemos lograrlo usando colores.


Como ejemplo, incluyamos la isla en donde se tomo la medici√≥n de cada pinguino:

In [None]:
df.head()

In [None]:
fig = px.scatter(
    df,
    x="flipper_length_mm",
    y="body_mass_g",
    color="island",
)

fig.show()


Noten que en este caso el color representa una variable categ√≥rica, en donde cada isla tom√≥ un color en particular.


> **Pregunta ‚ùì**: Entonces, ¬øc√≥mo represento una variable num√©rica al trabajr con colores?


#### Luminiscencia

Sin emabrgo, si fuese una variable continua, estos colores nada nos dir√≠an con respecto a la magnitud de esta nueva variable. 

Para poder representar podemos usar paletas de colores continuas, en donde se utiliza un conjunto de colores con distinta **luminiscencia** (que tanto brilla un color) de tal forma que algunos colores indican bajo valor y otros alto.

En este caso, el gr√°fico incluye una variable que no est√° representada por los puntos del gr√°fico de dispersi√≥n.

In [None]:
fig = px.scatter(
    df,
    x="flipper_length_mm",
    y="body_mass_g",
    color="culmen_length_mm",
    color_continuous_scale="viridis_r"
)


fig.show()


In [None]:
# un vistazo de todas las paletas de colores continuas disponibles

fig = px.colors.sequential.swatches_continuous()
fig.show()

Consideremos ahora el siguiente ejemplo, en donde generamos 15 bins para `body_mass_g` y despu√©s los graficamos

In [None]:
df_ = df.copy()
df_.loc[:, "body_mass_g_bins"] = pd.cut(
    df.loc[:, "body_mass_g"], 15, labels=[f"Bin {i+1}" for i in range(0, 15)]
)

fig = px.scatter(
    df_,
    x="flipper_length_mm",
    y="body_mass_g",
    color="body_mass_g_bins",
    color_continuous_scale="viridis_r",
)


fig.show()


> **Pregunta‚ùì**: ¬øCu√°l es el problema en este gr√°fico?

**Cuidado con los colores!**

Tiende a pasar que se sobreutilizan los colores. Esto induce finalmente a que el color tienda a confundir m√°s que a ayudar.

> **Pregunta ‚ùì** ¬øQu√© precauciones debemos tener al usar colores en nuestras visualizaciones?


Relacionado: [viridis](https://cran.r-project.org/web/packages/viridis/vignettes/intro-to-viridis.html)

### Forma

Otro par√°metro que tambi√©n nos permitir√≠a incluir una variable es la forma de los puntos.

In [None]:
species_symbol = df.loc[:, "species"].replace(
    {"Adelie": "circle", "Gentoo": "square", "Chinstrap": "star"}
)

df["species_symbol"] = species_symbol
df.head()

In [None]:
fig = px.scatter(
    df, x="flipper_length_mm", y="body_mass_g",  symbol="species"
)
#.update_traces(marker=dict(size=12), selector=dict(mode='markers'))


fig.show()

Al igual que el color por categor√≠a, los s√≠mbolos no permiten distinguir las magnitudes de las variables. 


> **Nota:** `plotly` permite de todas formas combinar colores continuos con s√≠mbolos, sin embargo, la leyenda deja de funcionar correctamente. 

In [None]:
fig = px.scatter(
    df,
    x="flipper_length_mm",
    y="body_mass_g",
    color="culmen_length_mm",
    symbol="species_symbol",
)

fig.update_traces(
    marker=dict(size=12, line=dict(width=2, color="DarkSlateGrey")),
    selector=dict(mode="markers"),
)

fig.show()

La leyenda puede ser desactivada modificarla usando: 

In [None]:
fig.update_layout(legend=dict(
    yanchor="top",
    y=0.99,
    xanchor="left",
    x=0.01
))
fig.show()

> **Pregunta:** ¬øCu√°ntas formas distintas m√°ximas deber√≠an usarse?

Ojal√° no m√°s de 4

### Tama√±o

El √∫ltimo punto a considerar es el tama√±o de cada punto, el cual permite tambi√©n establecer relaci√≥n entre las observaciones.

In [None]:
df.head()

In [None]:
fig = px.scatter(
    df,
    x="flipper_length_mm",
    y="culmen_length_mm",
    size="body_mass_g",
    size_max=20,
)

fig.show()


In [None]:
fig = px.scatter(
    df,
    x="flipper_length_mm",
    y="culmen_length_mm",
    color="island",
    size="body_mass_g",
    size_max=10,
)

fig.show()

### Cierre


Seg√∫n el √°rticulo original del cual est√° basado esta clase, el ser humano percibe estos par√°metros seg√∫n el siguiente orden:

1. Posici√≥n
2. Tama√±o
3. Color
4. Forma

Obviamente ustedes deciden a cual darle m√°s importancia. Lo importante es tener en mente que no por tener muchs elementos la visualizaci√≥n ser√° mejor, si no que **todo debe ser hecho de la forma m√°s sencilla posible, pero no debe ser simple**

## 3.- Usar el Gr√°fico Correcto para la Tarea por Resolver

Cada tipo de tarea que queramos resolver a tiene asociado uno o varios tipo de gr√°ficos que le permitir√≠an visualizar los datos.

Aqu√≠ debemos escoger:

1. La herramienta para graficar.
2. La visualizaci√≥n que mejor se ajuste a lo que queremos representar.

### Plotly

`Plotly` es una biblioteca de visualizaci√≥n de datos interactiva que permite crear gr√°ficos y visualizaciones personalizadas de alta calidad en varios lenguajes de programaci√≥n como Python, R y JavaScript.

En particular, para el curso estaremos usando `Plotly Express`, el es una capa de interfaz de alto nivel que simplifica la creaci√≥n de gr√°ficos mediante la automatizaci√≥n de muchas de las tareas comunes de visualizaci√≥n y una alta compatiblidad con las herramientas de ciencia de datos como numpy o pandas.


`Plotly express` incluye 30 distintos tipos de gr√°ficos en una interfaz muy unificada y sencilla basada en funciones que usualmente siguen la siguiente sintaxis:


```python
px.{nombre_del_grafico} (
    {df},
    x={variable},
    y={variable_2},
    color={variable_color},
    ... # otras configuraciones
)

```

Cada gr√°fico cuenta con una extensa documentaci√≥n. Por ejemplo para generar scatters, buscar en google [`px.scatter`](https://www.google.com/search?q=px.scatter) y ver tanto el manual de usuario como la API asociada.

### Scatter o Gr√°fico de Dispersi√≥n


Este (como hemos visto en las secciones anteriores) permite representar cada observaci√≥n a trav√©s de puntos ubicado en los dos ejes de un plano cartesiano. 

Todos los detalles en: https://plotly.com/python/line-and-scatter/


In [None]:
px.scatter(
    df,
    x="flipper_length_mm",
    y="body_mass_g",
)


> **Nota:** Un problema de los scatter plot es que dos puntos ubicados en la misma posici√≥n ser√°n indistinguibles entre si.


Una forma de solucionar esto es agregar un peque√±o movimiento aleatorio a los puntos. Esto se puede obtener a trav√©s de los strip charts:

https://plotly.com/python/strip-charts/

In [None]:
px.strip(df, x="flipper_length_mm", y="body_mass_g")

### Gr√°ficos de Linea

En el caso de tener una variable temporal, podemos utilizar gr√°ficos de linea para representar su cambio:

In [None]:
px.data.gapminder().head(10)

In [None]:
df_gapminder = px.data.gapminder()
df_gapminder = df_gapminder[
    df_gapminder.country.isin(
        [
            "Chile",
            "Argentina",
            "Peru",
            "Brazil",
            "Colombia",
            "Mexico",
            "United States",
            "Uruguay",
        ]
    )
]

fig = px.line(df_gapminder, x="year", y="pop", color="country", markers=True)
fig.show()

### Scatter Matrix

https://plotly.com/python/splom/

Nos permite generar multiples scatters que detalla la interacci√≥n entre m√∫ltiples variables.

In [None]:
fig = px.scatter_matrix(
    df,
    height=600,
    dimensions=[
        "culmen_length_mm",
        "culmen_depth_mm",
        "flipper_length_mm",
        "body_mass_g",
    ],
    symbol="species",
    color="species",
)
fig.show()

### Coordenadas Paralelas

Forma alternativa de graficar varias variables en una:

In [None]:
# mapeo de clases a n√∫meros
df["species_num"] = df["species"].replace({"Adelie": 0, "Chinstrap": 1, "Gentoo": 2})

fig = px.parallel_coordinates(
    df,
    color="species_num",
    color_continuous_scale=px.colors.diverging.Tealrose,
    color_continuous_midpoint=1,
)
fig.show()

### Histogramas

Los histogramas permiten observar como distribuyen las variables a trav√©s de un conteo de estas.

In [None]:
fig = px.histogram(df, x="flipper_length_mm")
fig.show()

Un detalle muy importante de los histogramas es como se generan las particiones de los rangos de cada barra (tambi√©n conocidos como **bins**)


Bins muy finos pueden llevar a discontinuidades:

In [None]:
fig = px.histogram(df, x="flipper_length_mm", nbins=100)
fig.show()

Bins muy grandes pueden llevar a distorsionar la informaci√≥n:

In [None]:
fig = px.histogram(df, x="flipper_length_mm", nbins=5)
fig.show()

Podemos agregar m√°s informaci√≥n a los histogramas a trav√©s del color:

In [None]:
fig = px.histogram(df, x="flipper_length_mm", color="species")
fig.show()

In [None]:
fig = px.histogram(df, x="flipper_length_mm", barmode="overlay", color="species", )
fig.show()

Hay que ser muy cuidadoso si se le agrega color!
El gr√°fico anterior es muy complicado de entender. Ser√≠a mejor separar por grupos las barras.

In [None]:
fig = px.histogram(df, 
                   x="flipper_length_mm", 
                   color="species", 
                   barmode="group",)
fig.show()

### Torta

Permiten ilustrar proporciones de una variable.


In [None]:
df_grouped = (
    df.groupby(["island"])
    .agg({"species": "count"})
    .div(len(df))
    .mul(100)
    .round(2)
    .reset_index()
    .rename(columns={'species': 'cantidad'})
)
df_grouped

In [None]:
px.pie(df_grouped, values="cantidad", names="island")

### Boxplots

Permiten visualizar cuartiles y outliers de una variable.


In [None]:
px.histogram(df, x="flipper_length_mm", color="species", marginal='box', height=800)

### Violin

Permiten ver la distribuci√≥n de distintas variables


In [None]:
px.violin(df, x="flipper_length_mm", color="species")

Otros gr√°ficos interesantes:

- Sunbrust: Gr√°fico de torta con m√°s de una variable.
- Coropl√©tico: Coloreo de regiones en un mapa.
- Gr√°ficos de calor: muestra la densidad de una variable en una zona.
- Gran etc...

Visitar https://plotly.com/python/ para m√°s informaci√≥n.

---

## 4.- La Tinta es Barata, los Electrones A√∫n M√°s

El √∫ltimo se refiere al hecho de que no es necesario intentar incluir todos los aspectos que se quiera analizar en un solo gr√°fico, si no que por el contrario, podemos crear m√∫ltiples gr√°ficos con distintos grupos por analizar sin mayores problemas. En terminos pr√°cticos, el separar un gr√°fico implica una ventaja inesperada: incluir una nueva variable al an√°lisis tambi√©n conocida como el grupo de separaci√≥n.

> La Tinta es Barata, los Electrones A√∫n M√°s -> Hace m√°s de un gr√°fico!

El siguiente ejemplo muestra como podemos hacer un an√°lisis diferenciado por especie del peso y el tama√±o de la aleta.

In [None]:
df.head()

In [None]:
fig = px.scatter(df, x="flipper_length_mm", y="body_mass_g", color="culmen_length_mm")
fig.show()

In [None]:
fig = px.scatter(
    df, x="flipper_length_mm", 
    y="body_mass_g", 
    color="culmen_length_mm", 
    facet_col="species",
    facet_row="sex",
    height=800
)

fig.show()

### Extra: Templates y Recorrido por la Documentaci√≥n


https://plotly.com/python/templates/

In [None]:
fig = px.scatter(
    df,
    x="flipper_length_mm",
    y="body_mass_g",
    color="body_mass_g",
    facet_col="species",
    template="plotly_dark",
)

fig.show()