# Analizando exoplanetas I

En esta actividad analizaremos datos exploratorios de los exoplanetas confirmados hasta la fecha. Los datos fueron obtenidos y procesados previamente, por lo que ahora nos dedicaremos a estudiar los parámetros. Los datos originales se encuentran en [NASA Exoplanet Archive](https://exoplanetarchive.ipac.caltech.edu). 

Primero, veamos la tabla procesada, para _ejecutar_ una celda (de código), puedes usar el botón Play de encima o hacer `Shift + Enter`, esto hará que el código muestre lo que debe hacer, no te preocupes del código en sí.

In [1]:
%matplotlib notebook
from modulos import * #El código que ejecuta todo por detrás está en este módulo, si te da curiosidad puedes ejecutarlo.
show_tab()

Unnamed: 0,pl_name,hostname,default_flag,sy_snum,sy_pnum,discoverymethod,disc_year,pl_orbper,pl_orbsmax,pl_rade,...,st_logg,st_age,rastr,ra,decstr,dec,sy_dist,sy_bmag,sy_vmag,hwc
0,11 Com b,11 Com,1,2,1,Radial Velocity,2007,323.21,1.178,,...,2.45,,12h20m42.91s,185.178779,+17d47m35.71s,17.793252,93.1846,5.726,4.72307,0
1,11 UMi b,11 UMi,1,1,1,Radial Velocity,2009,516.21997,1.53,,...,1.93,,15h17m05.90s,229.274595,+71d49m26.19s,71.823943,125.321,6.382,5.013,0
2,14 And b,14 And,1,1,1,Radial Velocity,2008,186.76,0.775,,...,2.55,,23h31m17.80s,352.82415,+39d14m09.01s,39.235837,75.4392,6.256,5.23133,0
3,14 Her b,14 Her,1,1,2,Radial Velocity,2002,1765.0389,2.774,,...,,,16h10m24.50s,242.602101,+43d48m58.90s,43.816362,17.9323,7.495,6.61935,0
4,16 Cyg B b,16 Cyg B,1,3,1,Radial Velocity,1996,798.5,1.66,,...,4.36,,19h41m51.75s,295.465642,+50d31m00.57s,50.516824,21.1397,6.876,6.215,0


La tabla parece complicada, en cada fila vemos el nombre de un exoplaneta y cada columna es un parámetro del mismo, originalmente había muchas más pero estas son las relevantes, algunos ejemplos que estudiaremos son:
 - Método de descubrimiento `discoverymethod`
 - Periodo orbital `pl_orbper`
 - Es habitable? Según el catálogo [The habitable exoplanets catalogue](https://phl.upr.edu/projects/habitable-exoplanets-catalog), tendrá un 1 si lo es y un 0 si no.

En resumen, usaremos casi todas, y algunas están disponibles para que practiquen por su cuenta.

Bien, ahora empecemos con el método de descubrimiento, ya que nos dará una idea del desarrollo de la sub-área de la astronomía que se llama **ciencia de exoplanetas**.

## 1. Método de descubrimiento

_(Para este momento deberían haber recibido algo de información de los métodos de detección más comunes)_

Bien, primero veamos el conteo, de todos los exoplanetas ¿cuántos han sido descubiertos por qué método? La celda de abajo nos da un conteo.

In [2]:
show_methods()

Unnamed: 0,Method,Number
0,Radial Velocity,1075
1,Imaging,68
2,Eclipse Timing Variations,17
3,Transit,4153
4,Transit Timing Variations,28
5,Astrometry,3
6,Disk Kinematics,1
7,Microlensing,210
8,Orbital Brightness Modulation,9
9,Pulsation Timing Variations,2


¿Qué podemos comentar sobre estos métodos? Algunos cuentan con pocos descubrimientos, mientras algunos constituyen la mayoría de nuestra base de datos. ¿Qué complicaciones traen estos métodos? Investiga por tu cuenta alguno de los que tienen pocos exoplanetas, capaz es un método muy nuevo o demasiado ocasional.

Pero bien, nos enfocaremos en los más populares o más numerosos, entonces agruparemos a los métodos que tengan menos de `m` exoplanetas descubiertos en una categoría llamada `otros`. Pueden cambiar `m` por cualquier número en la celda de abajo y generará una nueva tabla agrupada. Por ejemplo si `m = 100` todos los métodos con menos de 100 exoplanetas se agrupan, pero si `m = 60` tendríamos que `imaging` será tomada en cuenta. 

In [3]:
m = 60
t, d_grouped = grouped_methods(m)
t

Unnamed: 0,Method,Number
0,Radial Velocity,1075
1,Imaging,68
2,Transit,4153
3,Microlensing,210
4,Others,67


Ahora veremos los descubrimientos por año, para esto usaremos un histograma que nos mostrará cuántos descubrimientos en total tendremos por cada año. 

In [4]:
anual = True
gen_year_histo(anual)

<IPython.core.display.Javascript object>

Tenemos un problema, pues la cantidad de barras o separaciones (en Inglés _bins_) no es suficiente, es decir, tenemos una barra que abarca más de un año y no podemos ver cuántos exoplanetas fueron descubiertos por año, esto es originalmente porque para un histograma el número de _bins_ por defecto es 10. Ahora puedes cambiar el parámetro `anual` a `True` que hará que sí tome en cuenta los años.

¿Podemos ver la tendencia de cómo fueron descubiertos los exoplanetas? ¿Habrá sucedido algo en específico para ver algunos picos pronunciados? 

Primero, veamos el mismo gráfico pero con los exoplanetas descubiertos por método. Usaremos un histograma que separa por colores las barras y las coloca una encimas de otras (_stacked histogram_ en Inglés).

In [5]:
sep_year_histo(d_grouped)

<IPython.core.display.Javascript object>

Esto podría servir, por lo menos ahora sabemos qué método es el que marcó los picos importantes. Ahora trabajarán y se enfocarán en un solo método a la vez, usaremos los dos con más descubrimientos: Tránsito y Velocidad Radial.

### 1.1. Único método, histograma por año

In [6]:
metodo = "Transit"

fig, ax = year_hist(metodo)


<IPython.core.display.Javascript object>

<div class="alert alert-block alert-success"><b>Añadir eventos (líneas verticales): </b>Podemos usar una línea de código adicional para añadir una línea vertical y un pequeño título, así podremos denotar algo resaltante. POr ejemplo podemos mencionar que el 2014 hubo un nuevo telescopio. La nomenclatura es la siguiente: </div>

`add_event(figura, año, "titulo")`

`figura` es una variable que nos devuelve la función `year_hist`, y la volveremos a pasar a la función añadir evento para que trabaje sobre la misma. La documentación más detallada de la función es la siguiente:

In [7]:
help(add_event)

Help on function add_event in module modulos:

add_event(figu, val, lab=' ', pos='izq', alt=75, save=False, savename='')
    Añade una linea vertical a una figura previamente creada
    
    Args:
        figu (Variable esp): Variable obtenida a través de otra función que genera figuras.
        val (int or float): Valor en el eje x donde añadiremos la linea
        lab (str): Texto que aparecerá sobre la linea. Defaults to " "
        pos (str, optional): Posición "izq" o "der" de la línea. Defaults to "izq".
        alt (int, optional): Altura en porcentaje del texto. Defaults to 75.



In [8]:
metodo = "Radial Velocity"

figura = year_hist(metodo)
add_event(figura, 2009, "Lanzamiento Kepler", alt = 60)
# nota que podemos modificar el año donde hacemos la línea, el título, y la altura
# incluso si queremos que el texto aparezca a la derecha o izquierda de la líunea.

<IPython.core.display.Javascript object>

<div class="alert alert-block alert-warning"><b>ACTIVIDAD: </b> Usa una tabla de eventos relevantes en la historia del descubrimiento de exoplanetas para añadir algunas líneas y explicar los picos necesarios. </div>

Puedes investigar los siguientes eventos (investiga si son relacionados con qué método): 
 - Lanzamiento del telescopio Kepler
 - La misión K2 (para ambos puntos sobre Kepler pueden leer [esta página](https://exoplanets.nasa.gov/alien-worlds/kepler-timeline/)
 - Lanzamiento de TESS
 - Publicación de HARPS
 - El primer exoplaneta: Pegasi 51b
 - CHEOPS
 
Puedes copiar el código de la celda de arriba y cambiarle el método.

In [9]:
metodo = "Transit"

figura = year_hist(metodo)
add_event(figura, 2018, "K2", alt = 60)
# nota que podemos modificar el año donde hacemos la línea, el título, y la altura
# incluso si queremos que el texto aparezca a la derecha o izquierda de la líunea.

<IPython.core.display.Javascript object>

## 2. ¿Y los habitables?
<img src="../figs/meme.png" alt="drawing" width="300"/>

Por ahora no nos enfocaremos en las características propias de los planetas habitables (como su tamaño, masa, etc.), primero vamos a ver cómo se descubrieron (ya que sabemos los métodos) y en esta actividad veremos la distancia, que en sí no es característica propia de un exoplaneta, sino de su órbita. 

In [12]:
sep_year_histo(d_grouped, hwc = True)

<IPython.core.display.Javascript object>

Vemos que todos se han descubierto con los métodos más comunes, esto se debe a que esencialmente para determinar si un exoplaneta es habitable o no necesitamos saber mucho del mismo, y usualmente los otros métodos no ofrecen información tan directa como uno espera.