# Problema: ¿Dónde está todo el mundo?


## Background: La Paradoja de Fermi

En 1950, mientras trabajaba en el Proyecto Manhattan, Enrico Fermi formuló la siguiente pregunta: Con la cantidad de estrellas que hay en la Vía Láctea, muchas de las cuales sin duda albergando planetas a su alrededor, seguro que hay una proporción significativa de los mismos con condiciones similares a las de la Tierra. De estos, habrá una proporción que, además, albergarán vida inteligente. Si es así, ¿cómo es que no hemos contactado con nadie? Este adagio es conocido como la Paradoja de Fermi y se considera una paradoja porque la observación empírica (cero extraterretres) contradice la intuición de que, a juzagar por los datos, la Vía Láctea debería rebosar de vida y, en particular, la Especie Humana debería encontrarse en medio de un enjambre de civilizaciones que van de aquí para allá.

Se han propuesto diversas soluciones a la paradoja, desde la más conservadora de que, simplemente, nuestro juicio de los datos es incorrecto hasta las más extravagantes, que sugieren que hay muchas formas de vida pero que la gran mayoría no son computables por nuestros sentidos; pasando por algunas algo ominosas, como que toda civilización debe superar, llegado cierto punto, una suerte de filtro cósmico que suele dar como resultado la extinción en la mayoría de los casos.

En esta actividad vamos a hacer uso de algunos datos para dar una posible respuesta a la Paradoja de Fermi.

## Parte 1: ¿Es la Tierra un planeta común en la Vía Láctea?

Descárgate el fichero planets.csv. En él hallarás datos sobre planetas extrasolares. Establecer una métrica de similitud entre la Tierra y otro planeta es complicado, pero para no forzar demasiado la máquina vamos a trabajar con un modelo muy simplificado. Supondremos que un planeta es homologable a la Tierra si sus valores para los siguientes parámetros no son más de un 10% distintos a los de la Tierra:
1. Periodo orbital (en días)
2. Masa (en masas de Júpiter)
3. Radio (en radios de Júpiter)
4. Temperatura estelar efectiva (en grados Kelvin)

La condición 4 resulta de relevancia evidente para nuestra supervivencia. La 1 puede o no ser relevante, pero cuanto más parecida a la de la Tierra menos probabilidad de fluctuaciones caóticas en el clima. La 3 y la 4 tienen que ver con la gravedad en la superfície del planeta, esta sí, de críticas consecuencias para una vida homologable a la humana.

Los valores de la Tierra son los siguientes:
1. 365.256 días
2. 0.0031453 masas de Júpiter
3. 0.08856 radios de Júpiter
4. 5500 K



In [None]:
from google.colab import files

uploaded = files.upload()

In [1]:
import pandas as pd 
import numpy as np
from scipy.stats import norm

path = 'data/planets.csv'
raw_df = pd.read_csv(path, index_col='rowid', skiprows=15)

# Valores de la Tierra 
tolerance = 0.10
earth_orbper_days = 365.256 
earth_massj = 0.0031453 
earth_radj = 0.08856 
earth_temp_k = 5500 

#- Periodo orbital (en días)  =  pl_orbper: Orbital Period [days]
#- Masa (en masas de Júpiter) = pl_bmassj: Planet Mass or M*sin(i)[Jupiter mass]
#- Radio (en radios de Júpiter) = pl_radj: Planet Radius [Jupiter radii]
#- Temperatura estelar efectiva (en grados Kelvin) = st_teff: Effective Temperature [K]

planets_df = raw_df[['pl_orbper', 'pl_bmassj', 'pl_radj', 'st_teff', 'st_dist']]
planets_df=planets_df.rename(columns={'pl_orbper': 'Orbital_Period_d', 'pl_bmassj': 'Mass_J', 
                                       'pl_radj':'Radious_J', 'st_teff':'Temp_K', 'st_dist': 'Distance_pc'})
planets_df = planets_df.round(3)
planets_df[planets_df.duplicated(subset=['Orbital_Period_d', 'Mass_J', 'Radious_J', 'Temp_K', 'Distance_pc'])].sum()
planets_df["index_x"] = planets_df.index
print(planets_df.shape)
planets_df.describe()

(3564, 6)


Unnamed: 0,Orbital_Period_d,Mass_J,Radious_J,Temp_K,Distance_pc,index_x
count,3482.0,1327.0,2805.0,3375.0,2418.0,3564.0
mean,2549.07,2.572574,0.359421,5519.407852,632.86873,1782.5
std,124104.2,4.231027,0.411342,1741.719988,840.702593,1028.982507
min,0.091,0.0,0.029,575.0,1.29,1.0
25%,4.64525,0.1935,0.138,5079.0,95.1575,891.75
50%,12.556,0.96,0.205,5616.0,494.5,1782.5
75%,45.147,2.64,0.304,5935.5,880.0,2673.25
max,7300000.0,30.0,6.9,57000.0,8500.0,3564.0


A partir del fichero de datos, estima la media y la desviación de estas 4 métricas para todos los planetas de la Via Láctea. Suponiendo que todas ellas siguen una distribución normal con los parámetros obtenidos y que se trata de medidas independientes, calcula la probabilidad de que un planeta de la Vía Láctea escogido al azar sea similar a la Tierra.

In [2]:
# Calcular la media Y la desviacion
total_planets = len(planets_df)
empiric_mean = np.mean(planets_df.loc[:, ['Orbital_Period_d', 'Mass_J', 'Radious_J', 'Temp_K']], axis=0)
empiric_std = np.std(planets_df.loc[:, ['Orbital_Period_d', 'Mass_J', 'Radious_J', 'Temp_K']], axis=0)

alpha = 0.05
z = norm.ppf(1. - alpha / 2.) 
correction = z * np.sqrt(empiric_std / total_planets)
print(f"Los IC para la media de las cuatro variables son: [{empiric_mean - correction}, {empiric_mean + correction}]", flush=True)

# Probabilidad de que un planeta de la vía láctea escogido al azar sea similar a la tierra 
earth_orbper_max = earth_orbper_days + (earth_orbper_days * tolerance)
earth_orbper_min = earth_orbper_days - (earth_orbper_days * tolerance)

earth_mass_max = earth_massj + (earth_massj * tolerance)  
earth_mass_min = earth_massj - (earth_massj * tolerance)  

earth_rad_max = earth_radj + (earth_radj * tolerance)  
earth_rad_min = earth_radj - (earth_radj * tolerance)  

earth_temp_max = earth_temp_k + (earth_temp_k * tolerance)  
earth_temp_min = earth_temp_k - (earth_temp_k * tolerance)  

cond_mass = ((earth_mass_min <= planets_df['Mass_J']) & (planets_df['Mass_J'] <= earth_mass_max))
cond_orb = ((earth_orbper_min <= planets_df['Orbital_Period_d']) & (planets_df['Orbital_Period_d'] <= earth_orbper_max))
cond_rad = ((earth_rad_min <= planets_df['Radious_J']) & (planets_df['Radious_J'] <= earth_rad_max))
cond_temp = ((earth_temp_min <= planets_df['Temp_K']) & (planets_df['Temp_K'] <= earth_temp_max))

prob1 = planets_df[cond_mass].Mass_J.count()/ total_planets
prob2 = planets_df[cond_orb].Orbital_Period_d.count() / total_planets
prob3 = planets_df[cond_rad].Radious_J.count() / total_planets
prob4 = planets_df[cond_temp].Temp_K.count() / total_planets

prob_sim_earth = prob1 * prob2 * prob3 * prob4
print("Probabilidad de que un planeta de la via láctea sea similar a la tierra es: {0}".format(prob_sim_earth, 3))

Los IC para la media de las cuatro variables son: [Orbital_Period_d    2537.505227
Mass_J                 2.505056
Radious_J              0.338367
Temp_K              5518.037802
dtype: float64, Orbital_Period_d    2560.634996
Mass_J                 2.640092
Radious_J              0.380476
Temp_K              5520.777901
dtype: float64]
Probabilidad de que un planeta de la via láctea sea similar a la tierra es: 1.0636007869256454e-07


## Parte 2: La Tierra, ¿dónde queda?

Usa métodos de estimación para dilucidar, con una confianza del 99%, cuál es la distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea. ¿Es la Tierra un lugar remoto de la galaxia?

In [3]:
# Calcular la distancia media entre la Tierra y un planeta cualquiera 
empiric_mean_distance = np.mean(planets_df.Distance_pc)
empiric_std_distance = np.std(planets_df.Distance_pc)
dist_media = 0 
alpha = 0.01
z = norm.ppf(1. - alpha / 2.) 
correction = z * np.sqrt(empiric_std_distance / len(planets_df))

print(f"IC para la Distancia media: [{empiric_mean_distance - correction}, {empiric_mean_distance + correction}]", flush=True)

dist_media = planets_df[(planets_df.Distance_pc <= (empiric_mean_distance + correction)) & (planets_df.Distance_pc >= (empiric_mean_distance - correction))].Distance_pc.mean()
print(f"La distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea es: {dist_media} pc")

IC para la Distancia media: [631.6178248217374, 634.1196358895944]
La distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea es: 632.6 pc


## Parte 3: Pues eso, que dónde está todo el mundo.

Aquí la distancia se da en pársecs, que equivalen a 3.1 años luz. Un año luz es la distancia cubierta por un fotón durante un año viajando por el vacío. En km equivale a un número absurdamente grande en términos humanamente cotidianos. Las leyes de la física impiden moverse a velocidades cercanas a la luz sin sufrir efectos extravagantes y desgradables, así que vamos a suponer que, en el mejor de los casos, una especie lo suficientemente avanzada puede viajar al 20% de la velocidad de la luz. Vamos a suponer también que el Universo tiene una topología lo bastante regular como para que no se puedan hacer trampas como atravesar agujeros de gusano, teletransportarse u obrar cualquier otro tipo de magia.

a) Suponiendo que el Homo Sapiens tiene una antigüedad de 200.000 años, estima el tiempo medio que tardaremos en contactar con una especie extraterrestre que emprendiera su viaje hacia la Tierra justo cuando nosotros comenzamos a pulular por el planeta.

b) Suponiendo, además, que dicha especie no tiene modo de saber a priori si un planeta albergará anfitriones y, por lo tanto, escoge uno al azar de entre los que tienen potencial, recalcula tu estimación sobre tiempo que tardaremos en recibir a alguien por casa.

c) Reflexiona sobre los resultados y razona hasta qué punto nos encontramos ante una paradoja. ¿Respaldan los datos la idea de que deberíamos haber contactado con otras civilizaciones extraterrestres?


In [28]:
# Parte a. Tiempo medio que tardaremos en contactar con una especie extraterrestre 

homo_sapiens_y = 200000 

# ly/pc
one_parsec = 3.1  

#lightspeed pc/y. Especie puede viajar al 20% de la velocidad de la luz
light_speed_in_pc_per_year = 0.307 
const_galaxy_speed = light_speed_in_pc_per_year * 0.20 

#To calculate the time we can use the formula t=d/v. dist(pc)/(pc/y)
mean_time = dist_media / const_galaxy_speed
time_travelling = homo_sapiens_y - mean_time

print(f"El tiempo promedio para recorrer la distancia media de la tierra a cualquier planeta de la galaxia es: {np.round(mean_time, 3)} años")
print(f"El tiempo en que demoraremos en contactar con una especie es: {np.round(time_travelling, 3)} años")

El tiempo promedio para recorrer la distancia media de la tierra a cualquier planeta de la galaxia es: 10302.932 años
El tiempo en que demoraremos en contactar con una especie es: 189697.068 años


In [33]:
# Parte b 

from functools import reduce
planets_mass = planets_df[cond_mass].Mass_J
planets_orb = planets_df[cond_orb].Orbital_Period_d 
planets_radious = planets_df[cond_rad].Radious_J
planets_temp = planets_df[cond_temp].Temp_K
dfs = [planets_orb, planets_mass, planets_radious, planets_temp]

#merge all DataFrames into one
merged_dfs = reduce(lambda left,right: pd.merge(left,right,on=['rowid'], how='outer'), dfs)
values = merged_dfs.index.values.tolist()

potential_planets = planets_df.loc[planets_df.index_x[values]]
potential_planets.dropna(inplace=True)
print(potential_planets.describe())
mean_time = mean_dist_pot_planets / const_galaxy_speed
time_travelling = homo_sapiens_y - mean_time
print(f"El tiempo para recorrer la distancia media de un planeta con potencial es: {np.round(mean_time, 3)} años")
print(f"El tiempo en que demoraremos en contactar con una especie es: {np.round(time_travelling, 3)} años")

       Orbital_Period_d      Mass_J   Radious_J       Temp_K  Distance_pc  \
count        208.000000  208.000000  208.000000   208.000000   208.000000   
mean          16.921505    1.177058    0.951231  5544.725962   502.084327   
std           42.226677    2.357315    0.448379   500.698755   419.238711   
min            0.737000    0.002000    0.029000  2559.000000    12.100000   
25%            2.756250    0.246750    0.742250  5400.000000   203.000000   
50%            4.045000    0.637000    1.080000  5631.500000   355.500000   
75%            9.448250    1.275000    1.265500  5802.000000   691.750000   
max          303.137000   28.000000    1.890000  6050.000000  2250.000000   

           index_x  
count   208.000000  
mean   1825.451923  
std    1404.436720  
min      28.000000  
25%     225.750000  
50%    2171.500000  
75%    3400.250000  
max    3529.000000  
El tiempo para recorrer la distancia media de un planeta con potencial es: 8177.269 años
El tiempo en que demoraremos

In [None]:
IC = [631.61, 634.12]
p_parecido_tierra = 8e-24

In [None]:
IC_azar = np.array(IC) / (0.2 / 3.1) / p_parecido_tierra
print(np.array(IC))

In [None]:
print(IC_azar)