# Problema: ¿Dónde está todo el mundo?


## Background: La Paradoja de Fermi

En 1950, mientras trabajaba en el Proyecto Manhattan, Enrico Fermi formuló la siguiente pregunta: Con la cantidad de estrellas que hay en la Vía Láctea, muchas de las cuales sin duda albergando planetas a su alrededor, seguro que hay una proporción significativa de los mismos con condiciones similares a las de la Tierra. De estos, habrá una proporción que, además, albergarán vida inteligente. Si es así, ¿cómo es que no hemos contactado con nadie? Este adagio es conocido como la Paradoja de Fermi y se considera una paradoja porque la observación empírica (cero extraterretres) contradice la intuición de que, a juzagar por los datos, la Vía Láctea debería rebosar de vida y, en particular, la Especie Humana debería encontrarse en medio de un enjambre de civilizaciones que van de aquí para allá.

Se han propuesto diversas soluciones a la paradoja, desde la más conservadora de que, simplemente, nuestro juicio de los datos es incorrecto hasta las más extravagantes, que sugieren que hay muchas formas de vida pero que la gran mayoría no son computables por nuestros sentidos; pasando por algunas algo ominosas, como que toda civilización debe superar, llegado cierto punto, una suerte de filtro cósmico que suele dar como resultado la extinción en la mayoría de los casos.

En esta actividad vamos a hacer uso de algunos datos para dar una posible respuesta a la Paradoja de Fermi.

## Parte 1: ¿Es la Tierra un planeta común en la Vía Láctea?

Descárgate el fichero planets.csv. En él hallarás datos sobre planetas extrasolares. Establecer una métrica de similitud entre la Tierra y otro planeta es complicado, pero para no forzar demasiado la máquina vamos a trabajar con un modelo muy simplificado. Supondremos que un planeta es homologable a la Tierra si sus valores para los siguientes parámetros no son más de un 10% distintos a los de la Tierra:
1. Periodo orbital (en días)
2. Masa (en masas de Júpiter)
3. Radio (en radios de Júpiter)
4. Temperatura estelar efectiva (en grados Kelvin)

La condición 4 resulta de relevancia evidente para nuestra supervivencia. La 1 puede o no ser relevante, pero cuanto más parecida a la de la Tierra menos probabilidad de fluctuaciones caóticas en el clima. La 3 y la 4 tienen que ver con la gravedad en la superfície del planeta, esta sí, de críticas consecuencias para una vida homologable a la humana.

Los valores de la Tierra son los siguientes:
1. 365.256 días
2. 0.0031453 masas de Júpiter
3. 0.08856 radios de Júpiter
4. 5500 K



In [None]:
from google.colab import files

uploaded = files.upload()

Saving planets.csv to planets.csv


In [None]:
import io
import pandas as pd 
import numpy as np
from scipy.stats import norm

path = io.BytesIO(uploaded['planets.csv'])
df = pd.read_csv(path, index_col='rowid', skiprows=15) #eliminar primer 15 filas
planets_df = df[['pl_orbper', 'pl_bmassj', 'pl_radj', 'st_teff', 'st_dist']]
planets_df[planets_df.duplicated(subset=['pl_orbper', 'pl_bmassj', 'pl_radj', 'st_teff', 'st_dist'])].sum() #hay duplicadps?
planets_df["index_x"] = planets_df.index #assigning the index values of the dataframe
print(planets_df.shape)

# OBTENEMOS UN DETALLE DE LOS DATOS SIGNIFICATIVOS DEL DF
planets_df.describe()




(3564, 6)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  planets_df["index_x"] = planets_df.index #assigning the index values of the dataframe


Unnamed: 0,pl_orbper,pl_bmassj,pl_radj,st_teff,st_dist,index_x
count,3482.0,1327.0,2805.0,3375.0,2418.0,3564.0
mean,2549.07,2.572577,0.359421,5519.407852,632.86873,1782.5
std,124104.2,4.231024,0.411342,1741.719988,840.702593,1028.982507
min,0.09070629,6e-05,0.029,575.0,1.29,1.0
25%,4.645043,0.1935,0.138,5079.0,95.1575,891.75
50%,12.55604,0.96,0.205,5616.0,494.5,1782.5
75%,45.14708,2.64,0.304,5935.5,880.0,2673.25
max,7300000.0,30.0,6.9,57000.0,8500.0,3564.0


A partir del fichero de datos, estima la media y la desviación de estas 4 métricas para todos los planetas de la Via Láctea. Suponiendo que todas ellas siguen una distribución normal con los parámetros obtenidos y que se trata de medidas independientes, calcula la probabilidad de que un planeta de la Vía Láctea escogido al azar sea similar a la Tierra.

In [None]:
# Calcular la media y las desviaciones
# Asumimos que las 4 métricas siguen una distribución normal
total_planets=len(planets_df)
empiric_mean= np.mean(planets_df.loc[:,['pl_orbper', 'pl_bmassj', 'pl_radj', 'st_teff']])
empiric_std= np.std(planets_df.loc[:,['pl_orbper', 'pl_bmassj', 'pl_radj', 'st_teff']])

print('\033[1m' + 'La media de cada métrica es:' + '\033[0m')
print("{}".format(np.round(empiric_mean,2)))
print('\033[1m' + 'La desviación de cada métrica es:' + '\033[0m')
print("{}".format(np.round(empiric_std,2)))

[1mLa media de cada métrica es:[0m
pl_orbper    2549.07
pl_bmassj       2.57
pl_radj         0.36
st_teff      5519.41
dtype: float64
[1mLa desviación de cada métrica es:[0m
pl_orbper    124086.38
pl_bmassj         4.23
pl_radj           0.41
st_teff        1741.46
dtype: float64


In [None]:
# Estudiamos la probabilidad de que un planeta de la vía láctea escogido al azar sea similar a la tierra

#Definimos los parámetros
tolerance =0.10
days= 365.256
masa= 0.0031453
radios =0.08856
temp =5500 

# Calculamos los intérvalos de tolerancia de cada métrica
period_max=days*(1+tolerance)
period_min=days*(1-tolerance)

mass_max=masa*(1+tolerance)
mass_min=masa*(1-tolerance)

radius_max=radios*(1+tolerance)
radius_min=radios*(1-tolerance)

teff_max=temp*(1+tolerance)
teff_min=temp*(1-tolerance)

# Definimos los intervalos

cond_orb = planets_df[((period_min <= planets_df['pl_orbper']) &
            (planets_df['pl_orbper'] <= period_max))]
cond_mass = planets_df[((mass_min <= planets_df['pl_bmassj']) &
             (planets_df['pl_bmassj'] <= mass_max))]
cond_rad = planets_df[((radius_min <= planets_df['pl_radj']) &
            (planets_df['pl_radj'] <= radius_max))]
cond_temp = planets_df[((teff_min <= planets_df['st_teff']) &
             (planets_df['st_teff'] <= teff_max))]

# Para hacernos una idea de la probabilidad de similitud a la tierra, calculamos cuántos planetas estan dentro de cada interválo
print('\033[1m' + 'Numéro de planetas que estan dentro de los intervalos de confianza de cada métrica:' + '\033[0m')
print("Masa:", len(cond_mass), "planetas")
print("Orbita:", len(cond_orb), "planetas")
print("Radio:", len(cond_rad), "planetas")
print("Temperatura:", len(cond_temp), "planetas")

[1mNuméro de planetas que estan dentro de los intervalos de confianza de cada métrica:[0m
Masa: 1 planetas
Orbita: 40 planetas
Radio: 102 planetas
Temperatura: 2103 planetas


Usamos la función de distribución acumulativa (cdf) del módulo de normas para calcular la probabilidad de que un planeta seleccionado al azar tenga valores dentro de los límites de similitud definidos para cada parámetro

In [None]:
from scipy.stats import norm

# Límites de similitud

# Probabilidad de que un planeta aleatorio tenga valores dentro de los límites de similitud
prob_period= norm.cdf(x=period_max, loc=empiric_mean['pl_orbper'], scale=empiric_std['pl_orbper'])-norm.cdf(x=period_min, loc=empiric_mean['pl_orbper'], scale=empiric_std['pl_orbper'])
prob_mass= norm.cdf(x=mass_max, loc=empiric_mean['pl_bmassj'], scale=empiric_std['pl_bmassj'])-norm.cdf(x=mass_min, loc=empiric_mean['pl_bmassj'], scale=empiric_std['pl_bmassj'])
prob_radius= norm.cdf(x=radius_max, loc=empiric_mean['pl_radj'], scale=empiric_std['pl_radj'])-norm.cdf(x=radius_min, loc=empiric_mean['pl_radj'], scale=empiric_std['pl_radj'])
prob_teff= norm.cdf(x=teff_max, loc=empiric_mean['st_teff'], scale=empiric_std['st_teff'])-norm.cdf(x=teff_min, loc=empiric_mean['st_teff'], scale=empiric_std['st_teff'])

In [None]:
print(prob_period)
print(prob_mass)
print(prob_radius)
print(prob_teff) 

0.00023482592942880576
4.9337538981175655e-05
0.013830717167380768
0.24785098490604718


In [None]:
#producto de todas estas probabilidades
prob_sim_earth = prob_period * prob_mass * prob_radius * prob_teff
print("Probabilidad de que un planeta de la via láctea sea similar a la tierra es: {0}".format(prob_sim_earth, 3))

Probabilidad de que un planeta de la via láctea sea similar a la tierra es: 3.9715394585502985e-11


## Parte 2: La Tierra, ¿dónde queda?

Usa métodos de estimación para dilucidar, con una confianza del 99%, cuál es la distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea. ¿Es la Tierra un lugar remoto de la galaxia?

In [None]:
# Calcular la distancia media entre la Tierra y un planeta cualquiera, con una confianza de 99%
empiric_mean_distance = np.mean(planets_df.st_dist)
empiric_std_distance = np.std(planets_df.st_dist)

#definiendo las variables para el Z-score y el factor de corrección
dist_media=0 
alpha = 0.01 #nivel de significación, que se establece en 0,01 (nivel de confianza del 99 %
z = norm.ppf(1. - alpha / 2.) 
correction = z * np.sqrt(empiric_std_distance / len(planets_df))
IC_dist_earth = [
    empiric_mean_distance - correction, empiric_mean_distance + correction
]

print(f"IC para la Distancia media: [{empiric_mean_distance - correction}, {empiric_mean_distance + correction}]", flush=True)

dist_media = planets_df[(planets_df.st_dist <= (empiric_mean_distance + correction)) & (planets_df.st_dist >= (empiric_mean_distance - correction))].st_dist.mean()
print(f"La distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea es: {dist_media} pc")

IC para la Distancia media: [631.6178248217374, 634.1196358895944]
La distancia media entre la Tierra y un planeta cualquiera de la Vía Láctea es: 632.6 pc


## Parte 3: Pues eso, que dónde está todo el mundo.

Aquí la distancia se da en pársecs, que equivalen a 3.1 años luz. Un año luz es la distancia cubierta por un fotón durante un año viajando por el vacío. En km equivale a un número absurdamente grande en términos humanamente cotidianos. Las leyes de la física impiden moverse a velocidades cercanas a la luz sin sufrir efectos extravagantes y desgradables, así que vamos a suponer que, en el mejor de los casos, una especie lo suficientemente avanzada puede viajar al 20% de la velocidad de la luz. Vamos a suponer también que el Universo tiene una topología lo bastante regular como para que no se puedan hacer trampas como atravesar agujeros de gusano, teletransportarse u obrar cualquier otro tipo de magia.

a) Suponiendo que el Homo Sapiens tiene una antigüedad de 200.000 años, estima el tiempo medio que tardaremos en contactar con una especie extraterrestre que emprendiera su viaje hacia la Tierra justo cuando nosotros comenzamos a pulular por el planeta.

b) Suponiendo, además, que dicha especie no tiene modo de saber a priori si un planeta albergará anfitriones y, por lo tanto, escoge uno al azar de entre los que tienen potencial, recalcula tu estimación sobre tiempo que tardaremos en recibir a alguien por casa.

c) Reflexiona sobre los resultados y razona hasta qué punto nos encontramos ante una paradoja. ¿Respaldan los datos la idea de que deberíamos haber contactado con otras civilizaciones extraterrestres?


In [None]:
# Parte a. Tiempo medio que tardaremos en contactar con una especie extraterrestre 

homo_sapiens_y = 200000 

# ly/pc
one_parsec = 3.1  

#lightspeed pc/y. Especie puede viajar al 20% de la velocidad de la luz
light_speed_in_pc_per_year = 0.307 #buscando en internet
const_galaxy_speed = light_speed_in_pc_per_year * 0.20 

#Para calcular el tiempo podemos usar la formula t=d/v. dist(pc)/(pc/a)
mean_time = dist_media / const_galaxy_speed

print(f"El tiempo promedio para recorrer la distancia media de la tierra a cualquier planeta de la galaxia es: {np.round(mean_time, 3)} años")

# Restando la edad del Homo Sapiens del tiempo promedio de edad del Homo Sapiens, para obtener el tiempo que nos tomará contactar con una especie extraterrestre
time_to_contact = homo_sapiens_y -mean_time

print(f"El tiempo medio que tardaremos en contactar con una especie extraterrestre que emprendiera su viaje hacia la Tierra justo cuando nosotros comenzamos a pulular por el planeta es: {time_to_contact} años")

El tiempo promedio para recorrer la distancia media de la tierra a cualquier planeta de la galaxia es: 10302.932 años
El tiempo medio que tardaremos en contactar con una especie extraterrestre que emprendiera su viaje hacia la Tierra justo cuando nosotros comenzamos a pulular por el planeta es: 189697.0684039088 años


In [None]:
# Parte b) Tiempo medio que una especie extraterrestre tardaria en contactarnos eligiendo al azar la tierra como destino.

# Obtenemos la distancia usando el IC de la distancia y la probabilidad de que un planeta sea similar a la tierra.
dist_azar_sim_earth = np.array(IC_dist_earth) / (0.2/one_parsec) / prob_sim_earth

# Calcuamos el tiempo sabiendo que velocidad = distancia/tiempo 
mean_time_azar = dist_azar_sim_earth/const_galaxy_speed

print(f"El tiempo para recorrer la distancia media de un planeta similar a la tierra escogido al azar es: {mean_time_azar} años")

El tiempo para recorrer la distancia media de un planeta similar a la tierra escogido al azar es: [4.01475292e+15 4.03065519e+15] años


In [None]:
# Parte C: Conclusiones

Los resultados del cálculo proporcionan una estimación del tiempo medio que tardaría una especie extraterrestre en llegar a la Tierra, basándose en una serie de suposiciones y simplificaciones. Sin embargo, es importante tener en cuenta que esta estimación debe tomarse con precaución, ya que se basa en varias suposiciones que pueden no ser ciertas en la realidad.

Además, el cálculo también supone que las especies extraterrestres tendrían la tecnología y la disposición para viajar distancias interestelares. La existencia de vida extraterrestre, y aún más la existencia de vida inteligente extraterrestre, sigue siendo un tema de investigación y debate científico en curso, y actualmente se desconoce si tales formas de vida existen y si tienen la tecnología y la disposición para viajar distancias interestelares.

**Con base en estas suposiciones y simplificaciones, los datos no brindan evidencia para respaldar la idea de que ya deberíamos habernos contactado con otras civilizaciones extraterrestres. Resultado del tiempo que tardaremos en contactar con una expecie extraterrestre sugiere que es poco probable que entremos en contacto con una especie extraterrestre que está eligiendo un planeta al azar entre aquellos con potencial para albergar vida. Esto se debe a que el tiempo que tardaría una especie extraterrestre en llegar a la Tierra en este escenario es increíblemente grande, del orden de 4e+15 años, que es mucho mayor que la edad del universo, 13.800 millones de años.**

En resumen, si bien el cálculo proporciona una estimación del tiempo promedio que le tomaría a una especie extraterrestre llegar a la Tierra, debe tomarse con precaución ya que se basa en varias suposiciones y simplificaciones que pueden no ser ciertas en la realidad.