# Problema: ¿Dónde está todo el mundo?


## Background: La Paradoja de Fermi

En 1950, mientras trabajaba en el Proyecto Manhattan, Enrico Fermi formuló la siguiente pregunta: Con la cantidad de estrellas que hay en la Vía Láctea, muchas de las cuales sin duda albergando planetas a su alrededor, seguro que hay una proporción significativa de los mismos con condiciones similares a las de la Tierra. De estos, habrá una proporción que, además, albergarán vida inteligente. Si es así, ¿cómo es que no hemos contactado con nadie? Este adagio es conocido como la Paradoja de Fermi y se considera una paradoja porque la observación empírica (cero extraterretres) contradice la intuición de que, a juzagar por los datos, la Vía Láctea debería rebosar de vida y, en particular, la Especie Humana debería encontrarse en medio de un enjambre de civilizaciones que van de aquí para allá.

Se han propuesto diversas soluciones a la paradoja, desde la más conservadora de que, simplemente, nuestro juicio de los datos es incorrecto hasta las más extravagantes, que sugieren que hay muchas formas de vida pero que la gran mayoría no son computables por nuestros sentidos; pasando por algunas algo ominosas, como que toda civilización debe superar, llegado cierto punto, una suerte de filtro cósmico que suele dar como resultado la extinción en la mayoría de los casos.

En esta actividad vamos a hacer uso de algunos datos para dar una posible respuesta a la Paradoja de Fermi.

## Parte 1: ¿Es la Tierra un planeta común en la Vía Láctea?

Descárgate el fichero planets.csv. En él hallarás datos sobre planetas extrasolares. Establecer una métrica de similitud entre la Tierra y otro planeta es complicado, pero para no forzar demasiado la máquina vamos a trabajar con un modelo muy simplificado. Supondremos que un planeta es homologable a la Tierra si sus valores para los siguientes parámetros no son más de un 10% distintos a los de la Tierra:
1. Periodo orbital (en días)
2. Masa (en masas de Júpiter)
3. Radio (en radios de Júpiter)
4. Temperatura estelar efectiva (en grados Kelvin)

La condición 4 resulta de relevancia evidente para nuestra supervivencia. La 1 puede o no ser relevante, pero cuanto más parecida a la de la Tierra menos probabilidad de fluctuaciones caóticas en el clima. La 3 y la 4 tienen que ver con la gravedad en la superfície del planeta, esta sí, de críticas consecuencias para una vida homologable a la humana.

Los valores de la Tierra son los siguientes:
1. 365.256 días
2. 0.0031453 masas de Júpiter
3. 0.08856 radios de Júpiter
4. 5500 K



In [1]:
#from google.colab import files
#uploaded = files.upload()

In [2]:
import io
import pandas as pd
import numpy as np
from scipy.stats import norm

path = 'data/planets.csv'
#path = io.BytesIO(uploaded['planets.csv'])
raw_df = pd.read_csv(path, index_col='rowid', skiprows=15)

# Valores de la Tierra
tolerance = 0.10
earth_orbper_days = 365.256
earth_massj = 0.0031453
earth_radj = 0.08856
earth_temp_k = 5500

#- Periodo orbital (en días)  =  pl_orbper: Orbital Period [days]
#- Masa (en masas de Júpiter) = pl_bmassj: Planet Mass or M*sin(i)[Jupiter mass]
#- Radio (en radios de Júpiter) = pl_radj: Planet Radius [Jupiter radii]
#- Temperatura estelar efectiva (en grados Kelvin) = st_teff: Effective Temperature [K]

planets_df = raw_df[[
    'pl_orbper', 'pl_bmassj', 'pl_radj', 'st_teff', 'st_dist'
]]
planets_df = planets_df.rename(
    columns={
        'pl_orbper': 'Orbital_Period_d',
        'pl_bmassj': 'Mass_J',
        'pl_radj': 'Radious_J',
        'st_teff': 'Temp_K',
        'st_dist': 'Distance_pc'
    })
planets_df[planets_df.duplicated(subset=[
    'Orbital_Period_d', 'Mass_J', 'Radious_J', 'Temp_K', 'Distance_pc'
])].sum()
planets_df.shape
planets_df.describe()

Unnamed: 0,Orbital_Period_d,Mass_J,Radious_J,Temp_K,Distance_pc
count,3482.0,1327.0,2805.0,3375.0,2418.0
mean,2549.07,2.572577,0.359421,5519.407852,632.86873
std,124104.2,4.231024,0.411342,1741.719988,840.702593
min,0.09070629,6e-05,0.029,575.0,1.29
25%,4.645043,0.1935,0.138,5079.0,95.1575
50%,12.55604,0.96,0.205,5616.0,494.5
75%,45.14708,2.64,0.304,5935.5,880.0
max,7300000.0,30.0,6.9,57000.0,8500.0


A partir del fichero de datos, estima la media y la desviación de estas 4 métricas para todos los planetas de la Via Láctea. Suponiendo que todas ellas siguen una distribución normal con los parámetros obtenidos y que se trata de medidas independientes, calcula la probabilidad de que un planeta de la Vía Láctea escogido al azar sea similar a la Tierra.

In [3]:
# Calcular la media Y la desviacion
empiric_mean = np.mean(
    planets_df.loc[:, ['Orbital_Period_d', 'Mass_J', 'Radious_J', 'Temp_K']],
    axis=0)
empiric_std = np.std(
    planets_df.loc[:, ['Orbital_Period_d', 'Mass_J', 'Radious_J', 'Temp_K']],
    axis=0)

print("La media de las 4 métricas de los planetas de la Via Láctea es: {}".
      format(np.round(empiric_mean, 3)))

print(
    "La desviación estándar de las 4 métricas de los planetas de la Via Láctea es: {}"
    .format(np.round(empiric_std,3)))

# Valores de tolerancia para que un planeta sea considerado similar a la tierra
earth_orbper_max = earth_orbper_days + (earth_orbper_days * tolerance)
earth_orbper_min = earth_orbper_days - (earth_orbper_days * tolerance)

earth_mass_max = earth_massj + (earth_massj * tolerance)
earth_mass_min = earth_massj - (earth_massj * tolerance)

earth_rad_max = earth_radj + (earth_radj * tolerance)
earth_rad_min = earth_radj - (earth_radj * tolerance)

earth_temp_max = earth_temp_k + (earth_temp_k * tolerance)
earth_temp_min = earth_temp_k - (earth_temp_k * tolerance)

cond_mass = ((earth_mass_min <= planets_df['Mass_J']) &
             (planets_df['Mass_J'] <= earth_mass_max))
cond_orb = ((earth_orbper_min <= planets_df['Orbital_Period_d']) &
            (planets_df['Orbital_Period_d'] <= earth_orbper_max))
cond_rad = ((earth_rad_min <= planets_df['Radious_J']) &
            (planets_df['Radious_J'] <= earth_rad_max))
cond_temp = ((earth_temp_min <= planets_df['Temp_K']) &
             (planets_df['Temp_K'] <= earth_temp_max))

La media de las 4 métricas de los planetas de la Via Láctea es: Orbital_Period_d    2549.070
Mass_J                 2.573
Radious_J              0.359
Temp_K              5519.408
dtype: float64
La desviación estándar de las 4 métricas de los planetas de la Via Láctea es: Orbital_Period_d    124086.378
Mass_J                   4.229
Radious_J                0.411
Temp_K                1741.462
dtype: float64


In [4]:
p_orbper = norm.cdf(x=earth_orbper_max,
                    loc=empiric_mean["Orbital_Period_d"],
                    scale=empiric_std["Orbital_Period_d"]) - norm.cdf(
                        x=earth_orbper_min,
                        loc=empiric_mean["Orbital_Period_d"],
                        scale=empiric_std["Orbital_Period_d"])

p_orbper

0.00023482592942880576

In [5]:
p_mass = norm.cdf(
    x=earth_mass_max, loc=empiric_mean["Mass_J"],
    scale=empiric_std["Mass_J"]) - norm.cdf(x=earth_mass_min,
                                            loc=empiric_mean["Mass_J"],
                                            scale=empiric_std["Mass_J"])

p_mass

4.9337538981175655e-05

In [6]:
p_temp = norm.cdf(
    x=earth_temp_max, loc=empiric_mean["Temp_K"],
    scale=empiric_std["Temp_K"]) - norm.cdf(x=earth_temp_min,
                                            loc=empiric_mean["Temp_K"],
                                            scale=empiric_std["Temp_K"])

p_temp

0.24785098490604696

In [7]:
p_rad = norm.cdf(x=earth_rad_max,
                 loc=empiric_mean["Radious_J"],
                 scale=empiric_std["Radious_J"]) - norm.cdf(
                     x=earth_rad_min,
                     loc=empiric_mean["Radious_J"],
                     scale=empiric_std["Radious_J"])

p_rad

0.013830717167380768

In [8]:
prob_sim_earth = p_orbper * p_mass * p_rad * p_temp
print(
    "Probabilidad de que un planeta de la via láctea sea similar a la tierra es: {0}"
    .format(prob_sim_earth))

Probabilidad de que un planeta de la via láctea sea similar a la tierra es: 3.971539458550295e-11


## Parte 2: La Tierra, ¿dónde queda?

Usa métodos de estimación para dilucidar, con una confianza del 99%, cuál es la distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea. ¿Es la Tierra un lugar remoto de la galaxia?

In [26]:
# Calcular la distancia media entre la Tierra y un planeta cualquiera
empiric_mean_distance = np.mean(planets_df.Distance_pc)
empiric_std_distance = np.std(planets_df.Distance_pc)
dist_media = 0
alpha = 0.01
z = norm.ppf(1. - alpha / 2.)
correction = z * empiric_std_distance / np.sqrt(len(planets_df))
IC_dist_earth = [
    empiric_mean_distance - correction, empiric_mean_distance + correction
]

print(f"IC para la Distancia media: {IC_dist_earth}", flush=True)

dist_media = planets_df[
    (planets_df.Distance_pc <= (empiric_mean_distance + correction))
    & (planets_df.Distance_pc >=
       (empiric_mean_distance - correction))].Distance_pc.mean()
print(
    f"La distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea es: {dist_media} pc"
)

IC para la Distancia media: [596.6026352827735, 669.1348254285583]
La distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea es: 633.4994696969696 pc


## Parte 3: Pues eso, que dónde está todo el mundo.

Aquí la distancia se da en pársecs, que equivalen a 3.1 años luz. Un año luz es la distancia cubierta por un fotón durante un año viajando por el vacío. En km equivale a un número absurdamente grande en términos humanamente cotidianos. Las leyes de la física impiden moverse a velocidades cercanas a la luz sin sufrir efectos extravagantes y desgradables, así que vamos a suponer que, en el mejor de los casos, una especie lo suficientemente avanzada puede viajar al 20% de la velocidad de la luz. Vamos a suponer también que el Universo tiene una topología lo bastante regular como para que no se puedan hacer trampas como atravesar agujeros de gusano, teletransportarse u obrar cualquier otro tipo de magia.

a) Suponiendo que el Homo Sapiens tiene una antigüedad de 200.000 años, estima el tiempo medio que tardaremos en contactar con una especie extraterrestre que emprendiera su viaje hacia la Tierra justo cuando nosotros comenzamos a pulular por el planeta.

b) Suponiendo, además, que dicha especie no tiene modo de saber a priori si un planeta albergará anfitriones y, por lo tanto, escoge uno al azar de entre los que tienen potencial, recalcula tu estimación sobre tiempo que tardaremos en recibir a alguien por casa.

c) Reflexiona sobre los resultados y razona hasta qué punto nos encontramos ante una paradoja. ¿Respaldan los datos la idea de que deberíamos haber contactado con otras civilizaciones extraterrestres?


In [12]:
# Parte a. Tiempo medio que tardaremos en contactar con una especie extraterrestre
homo_sapiens_y = 200000

# ly/pc
one_parsec = 3.1

#lightspeed pc/y. Especie puede viajar al 20% de la velocidad de la luz
light_speed_in_pc_per_year = 0.307
const_galaxy_speed = light_speed_in_pc_per_year * 0.20

#To calculate the time we can use the formula t=d/v. dist(pc)/(pc/y)
mean_time = dist_media / const_galaxy_speed

print(
    f"El tiempo promedio para recorrer la distancia media de la tierra es: {np.round(mean_time, 3)} años"
)

El tiempo promedio para recorrer la distancia media de la tierra es: 10317.581 años


In [13]:
# Parte b

#Get the distance using the IC de la distancia y la probabilidad de que un planeta sea similar a la tierra.
distance_azar_sim_earth = np.array(IC_dist_earth) / (0.2 /
                                                    3.1) / prob_sim_earth

#Calculate the time 
mean_time = np.divide(distance_azar_sim_earth, const_galaxy_speed)

print(
    f"El tiempo para recorrer la distancia media de un planeta similar a la tierra escogido al azar es: {mean_time} años"
)

El tiempo para recorrer la distancia media de un planeta similar a la tierra escogido al azar es: [3.79218584e+15 4.25322227e+15] años


### Conclusión a la pregunta ¿dónde están todos? 

De acuerdo con los datos que analizamos, podemos concluir lo siguiente: 

**1.** Consideramos cuatro métricas para poder establecer si un planeta es similar a la tierra.  Las 4 métricas son: 

|    **Metric**    | **Values** |
|:---------------- |-----------:|
| Orbital_Period_d |    365.256 |
| Mass_J           |  0.0031453 |
| Radious_J        |    0.08856 |
| Temp_K           |       5500 |

**2.** Al calcular la media y la desviación estándar de los planetas de la via Láctea los valores son los siguientes: 

| **Metric**       | **Media** |   **Std**  |
|:-----------------|---------: |----------: |
| Orbital_Period_d |  2549.070 | 124086.378 |
| Mass_J           |     2.573 |      4.229 |
| Radious_J        |     0.359 |      0.411 |
| Temp_K           |  5519.408 |   1741.462 |

**3.** La probabilidad de encontrar un planeta similar a la tierra, es decir que cumpla las 4 métricas del punto 1 en todos los planetas de la vía Láctea es: 3.971539458551234e-11. Esta probabilidad es muy baja por lo tanto de los planetas que observamos en el dataset la probabilidad de que alguno sea similar a la tierra es demasiado baja. 

**4.** La distancia media entre un planeta cualquiera y la tierra con una confianza del 99% es 632.6 pc. 1 pc equivale a 3.1 años luz.  

**5.** El tiempo promedio para recorrer la distancia media de la tierra es: 10302.932 años

**6.** El tiempo para recorrer la distancia media de un planeta similar a la tierra escogido al azar es: 4.01475292e+15 años

**7.** A la pregunta dónde están todos? Podemos responder basados en los datos que la probabilidad de encontrar un planeta similar a la tierra es muy baja y que el tiempo promedio para recorrer la distancia media de una planeta de la via láctea a la tierra es de aproximadamente 10302 años, por lo cual si el homo sapiens tiene una antiguedad de más de 200.000 años, ya tendriamos que haber tenido algún contacto o conocimiento de vida extraterrestre. 