# Instructions to export slides

We might be interested in hiding the code of some slides, e.g. when displaying a video. In order to achieve this,
 the metadata of the cell has to be edited to include "to_remove" tag from the View->Cell Toolbar->Edit Metadata option.
 
For instance:
 
```js
{
    "tags": [
        "to_remove"
    ],
    "slideshow": {
        "slide_type": "slide"
    }
}
```

In order for this to take effect, the slideshow must be compile via the terminal using:
```sh
jupyter nbconvert presentation.ipynb --to slides --no-prompt --TagRemovePreprocessor.remove_input_tags {\"to_remove\"} --post serve --SlidesExporter.reveal_theme=simple
```

# Visualización de datos

Supongamos que tenemos el resultado del análisis de datos, de la simulación, del algorítmo de *machine learning*, etc. 

El último paso es la comunicación de estos resultados con una **visualización de datos**.

<img style="float: center;" src="clase4_imagenes/infographic.png" alt="alt text" width="600" height="600" class="blog-image">

* La visualización es un aspecto muy importante de la ciencia. 
* Hay muy pocos casos donde *no* necesitamos crear una representación gráfica de nuestro trabajo.
* Incluso en la matemática pura, una visualización buena puede ayudar mucho.

¿Por qué es tan importante? Porque nuestros cerebros procesan información visual muy rápidamente...

![](clase4_imagenes/bandwidth_brain.png)

### Cuarteto de Anscombe

En la clase sobre análisis de datos, vimos que es muy importante "explorar" los datos a ver como son. 

Una forma rápida y útil de hacer eso es... graficarlos.

Vamos a ver un ejemplo famoso de la estadística, llamado **"El Cuarteto de Anscombe"**.

![](clase4_imagenes/anscombes_quartet_valores.png)

El Cuarteto de Anscombe consiste en:

* 4 conjuntos de datos, con valores diferentes pero propiedades *estadísticas idénticas*:
* La *correlación* entre las variables es la misma.
* La recta obtenida mediante *regresión lineal* también es la misma.

Los gráficos de los datos y rectas obtenida mediante regresión lineal:

<img style="float: center;" src="clase4_imagenes/anscombes_quartet.png" alt="alt text" width="900" height="600" class="blog-image">

¡Los 4 conjuntos de datos son muy diferentes! El único gráfico que parece "normal" es el primero. Todos los otros muestran puntos con "estructura" (es decir, no parecen datos "reales"). 

Si no tenemos una razón para sospechar que haya estructura en los datos, podríamos concluir que hay algo mal en nuestros datos en los otros 3 gráficos.

Este ejemplo ilustra el uso de los gráficos para analizar rápidamente los datos, y posiblemente detectar problemas.

### Visualizaciones en la astronomía

* Las visualizaciones a veces nos permiten a *entender* los datos en una manera nueva.
* Hay muchos ejemplos en la astronomía, que es una ciencia que se basa en las representaciones gráficas de los datos.

<img style="float: right;" src="clase4_imagenes/HRDiagram-es.png">

### Diagrama de Hertzsprung-Russell

También se llaman *diagrama de color-magnitud* de las estrellas.


En tal diagrama graficamos el color (o temperatura) de una estrella contra su magnitud (o luminosidad).



* Secuencia principal (SP): donde se encuentran la mayoría de las estrellas. 
 * Baja luminosidad $\Rightarrow$ color rojo.
 * Alta luminosidad $\Rightarrow$ color azul.
* Otras regiones: la rama de las estrellas gigantes, supergigantes, enanas blancas.
* Cuando una estrella está terminando su vida en la secuencia principal, se mueve a las ramas de gigantes/supergigantes.

#### Ejemplo del uso del diagrama HR


Para determinar la edad de los cúmulos globulares de estrellas:

* Se supone que todas las estrellas se formaron en el mismo momento.
* Estrellas grandes y luminosas en la SP consumen todo su hidrógeno y se mueven a la rama de las gigantes después de un tiempo más corto que una estrella menos masiva.
* Podemos analizar cuantas estrellas en el cúmulo ya están en la rama de las gigantes, y así determinar la edad del cúmulo.

Hace 30 años las observaciones indicaron que los cúmulos globulares eran mayor en edad que el universo... 

El descubrimiento de la aceleración de la expansión del universo (en 1998) nos dio cuenta de que el universo era más antiguo de lo pensado hasta entonces, por lo cual esta aparente contradicción fue resuelta.

### Un ejemplo de la meteorología

<img style="float: right;" src="clase4_imagenes/OUN.gif">

Un globo meteorológico toma mediciones de temperatura, presión, punto de rocío, etc.

La línea roja es la temperatura, la línea verde es el punto de rocío.

La línea discontinua corresponde al gradiente adiabático (algo que podemos calcular con la física).

Estos diagramas son muy útiles para determinar la *estabilidad* (o no) del aire en una región.

Aire inestable tiene la tendencia de formar nubes, tormentas, etc.

### Infografías en las noticias...

![](clase4_imagenes/hurricane.jpg)

### Visualizaciones malas... (usted no lo haga)

(Fuente: http://viz.wtf/)

![](clase4_imagenes/bad_viz1.jpg)

![](clase4_imagenes/paper_graph.jpg)

<img style="float: center;" src="clase4_imagenes/monochromatic.png" alt="alt text" height="600" class="blog-image">

<img style="float: center;" src="clase4_imagenes/pinera.jpg" alt="alt text" width="800" height="600" class="blog-image">

### Creando gráficos en Python

* Matplotlib

<img style="float: center;" src="clase4_imagenes/matplotlib.png" alt="alt text" width="800" height="600" class="blog-image">

* Gráficos interactivos (Bokeh)

![](clase4_imagenes/bokeh.png)

In [1]:
import numpy as np

from bokeh.io import output_notebook
from bokeh.plotting import figure, show

# Set up data
N = 4000
x = np.random.random(size=N) * 100
y = np.random.random(size=N) * 100
radii = np.random.random(size=N) * 1.5
colors = ["#%02x%02x%02x" % (int(r), int(g), 150) for r, g in zip(np.floor(50+2*x), np.floor(30+2*y))]

In [2]:
output_notebook()

In [3]:
p = figure(width=400,height=400)
p.circle(x, y, radius=radii, fill_color=colors, fill_alpha=0.6, line_color=None)

In [4]:
show(p)

### Paraview

Paraview es un software de código abierto (gratuito) que permite visualizar datos de simulaciones.

<img style="float: center;" src="clase4_imagenes/paraview_website.png" alt="alt text" width="800" height="600" class="blog-image">

Paraview es muy utilizado en ingeniería, por ejemplo para visualizar y analizar simulaciones aeorodinámicas.

<img style="float: center;" src="clase4_imagenes/spitfire_paraview.png" alt="alt text" width="800" height="600" class="blog-image">

#### Visualizaciones con animaciones

* Ecos de luz en la estrella RS Pup

![](clase4_imagenes/rs_pup.gif)

#### Visualizaciones de simulaciones

* En una simulación tenemos toda la información para crear visualizaciones espectaculares.
* Ejemplo con una simulación de N-cuerpos:

<img style="float: center;" src="clase4_imagenes/galaxy_simulations.jpg" alt="alt text" width="800" height="600" class="blog-image">

* Imagenes "sintéticas" de galaxias generadas en simulaciones.
* Incluyen el cálculo preciso de las longitudes de onda de la luz según la composición de la galaxia.

![](clase4_imagenes/sunrise.jpg)

#### Visualización con "renderización de volúmenes" (Volume rendering)

* Si tenemos un objeto compuesto de materia continua (no solamente partículas) hay que usar otra manera de visualizarlo.
* Una opción es el uso de *volume rendering*
* El concepto de *volume rendering* es calcular las propiedades de los rayos de luz que pasan dentro del objeto.

![](clase4_imagenes/vol_ray_casting2.png)

Este se llama *ray casting*

A veces queremos aplicar una *proyección* a la imagen para que tenga el aspecto de una imagen con perspectiva.

![](clase4_imagenes/perspective.jpg)

#### Un ejemplo del uso de *volume rendering* en la astronomía

* Este método es muy útil para simulaciones hidrodinámicas (que incluyen el gas de la galaxia)

![](clase4_imagenes/gases.png)

#### Rendering

* El concepto de *rendering* (calcular los rayos de luz que pasan a través o que se reflejan de un objeto) es algo muy usado en arte hecho en los computadores.
* Hay programas disponibles que calculan la apariencia de un objeto según las luces que hay en el escenario, las propiedades de la materia del objeto, etc.
* Por ejemplo, para Linux, hay un programa (gratis!) llamado **Blender**.

![](clase4_imagenes/blender.jpeg)

* Se puede usar **Blender** para crear animaciones. Puede calcular algunos aspectos de la "física" de un objeto, aunque no se puede crear una simulación científica...

![](clase4_imagenes/wrecking_ball.gif)

* Hay algunos astronómos que han usado Blender para crear visualizaciones de simulaciones astrofísicas, por ejemplo:

<img style="float: center;" src="clase4_imagenes/protodisk.jpg" alt="alt text" width="800" height="600" class="blog-image">

Hay un programa diseñado específicamente para visualizaciones de simulaciones cosmológicas que se llama **Splotch**. Aplica la transformación de los datos para dar la impresión de perspectiva, ocupa *ray casting* como en el método de *volume rendering*, etc...

![](clase4_imagenes/cosmo_fly_around.gif)

#### *Ray Tracing*

Un área del mundo de computación gráfica (que está usado mucho en *rendering* es *ray tracing* (trazado de rayos). La idea es muy similar a *volume rendering* pero ahora incluimos la posibilidad de tener superficies reflectantes, también refracción, etc.

![](clase4_imagenes/ray-tracing-fuente.webp)

#### Un ejemplo (hecho por un programa escrito en C++)

![](clase4_imagenes/ray11.png)

# Realidad Virtual

Hoy en día tenemos la tecnología para visualizar en 3D de verdad, con la *realidad virtual* (VR, por sus siglos en inglés).

| ![](clase4_imagenes/oculus_rift.jpg) |
|-------------------------------------|
| Oculus Rift |

| ![](clase4_imagenes/google_cardboard.jpg) |
|------------------------------------------|
| Google Cardboard |

| ![](clase4_imagenes/sketchfab.jpg) |
|-----------------------------------|
| https://sketchfab.com |

#### Visualizaciones de simulaciones cosmológicas:

Créditos: *T.H Jarrett et al., Astronomy and Computing Volume 37, 2021, 100502*

<img style="float: center;" src="clase4_imagenes/VR_cosmology_Box.jpg" alt="alt text" width="600" height="600" class="blog-image">


<img style="float: center;" src="clase4_imagenes/VR_cosmology_2.jpg" alt="alt text" width="800" height="600" class="blog-image">


<img style="float: center;" src="clase4_imagenes/VR_cosmology.jpg" alt="alt text" width="800" height="600" class="blog-image">

## Resumen

* La visualización de datos es común a todas las áreas de la ciencia, por ejemplo la astronomía y ciencias atmosféricas.
* Python es probablemente el lenguaje más utilizado en ciencia para visualizar datos, por lo que complementa otros lenguajes (por ejemplo C es muy utilizado para simulaciones).
* Visualizar no tan solo sirve para comunicar resultados, sino que también para inspeccionar los datos y asegurarnos que tengan sentido (como vimos con el Cuarteto de Anscombe).
* La visualización puede ir desde gráficos de puntos en un espacio Cartesiano, hasta imágenes 3D.