<a href="https://colab.research.google.com/github/DiegoOrtiz08/Proyecto-exoplanetas/blob/main/Proyecto_Exoplanetas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Objetivo general**

El objetivo de este proyecto es crear una aplicación para analizar las características de todos los exoplanetas descubiertos.

# **Objetivos específicos**

1.      Implementar algoritmos para construir y recorrer matrices.

2.      Utilizar las librerías pandas y matplotlib, así como consultar los sitios web oficiales donde se encuentra toda la documentación.

3.      Descomponer un problema en subproblemas e implementar las funciones que los resuelven.

# **Descripción**

En este proyecto se trabaja con los datos de todos los planetas extrasolares confirmados (llamados exoplanetas), descubiertos entre 1988 y 2018 (más de 3000). Esta información se encuentra recopilada en la base de datos llamada Open Exoplanet Catalogue (https://www.kaggle.com/mrisdal/open-exoplanet-catalogue). En el archivo “exoplanetas.csv” se encuentra una versión simplificada de los datos originales. Se suprimen de este catálogo los planetas que no han sido confirmados, se eliminan algunas columnas y se modifican las clasificaciones de valores numéricos por valores categóricos.

Los campos de los datos incluyen atributos de estrellas y de planetas, métodos de descubrimiento y por supuesto, la fecha de los descubrimientos.


*(Texto extraído y modificado del curso 'Programación en Python' de la Universidad de los Andes)*

In [7]:
!pip install -U plotly
!pip install -U kaleido # Necesitamos esta librería para exportar las visualizaciones como imágenes estáticas

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [8]:
import plotly
import plotly.graph_objs as go
import plotly.express as px

In [12]:
import pandas as pd
import matplotlib.pyplot as plt
import math as m
import numpy as np

plt.rcParams.update({'font.size': 12})

pd.options.plotting.backend = "matplotlib"
pd.options.plotting.backend = "plotly"

In [13]:
datos=pd.read_csv('exoplanetas.csv')

In [14]:
datos.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3732 entries, 0 to 3731
Data columns (total 10 columns):
 #   Column              Non-Null Count  Dtype  
---  ------              --------------  -----  
 0   NOMBRE              3732 non-null   object 
 1   MASA                3732 non-null   float64
 2   DESCUBRIMIENTO      3732 non-null   int64  
 3   ACTUALIZACION       3732 non-null   object 
 4   ESTADO_PUBLICACION  3732 non-null   object 
 5   TIPO_DETECCION      3732 non-null   object 
 6   RA                  3732 non-null   float64
 7   DEC                 3732 non-null   float64
 8   DISTANCIA_ESTRELLA  3732 non-null   float64
 9   MASA_ESTRELLA       3732 non-null   float64
dtypes: float64(5), int64(1), object(4)
memory usage: 291.7+ KB


In [15]:
datos.head()

Unnamed: 0,NOMBRE,MASA,DESCUBRIMIENTO,ACTUALIZACION,ESTADO_PUBLICACION,TIPO_DETECCION,RA,DEC,DISTANCIA_ESTRELLA,MASA_ESTRELLA
0,HD 142022 A b,29.0,2005,5/26/2014,Published in a refereed paper,Radial Velocity,242.5625,-84.231389,35.87,0.99
1,2M J2126-81 b,13.3,2016,2/23/2016,Published in a refereed paper,Imaging,321.366667,-81.641111,24.75,0.4
2,HD 39091 b,10.3,2001,01/01/2011,Published in a refereed paper,Radial Velocity,84.2875,-80.468889,18.32,1.1
3,HD 137388 b,0.223,2011,08/02/2011,Published in a refereed paper,Radial Velocity,233.916667,-80.204722,38.0,0.86
4,GJ 3021 b,3.37,2000,7/29/2016,Published in a refereed paper,Radial Velocity,4.05,-79.851111,17.62,0.9


In [None]:
def cargar_datos(nombre_archivo:str)->pd.DataFrame:
    """ Carga los datos de un archivo csv y retorna el DataFrame con la informacion.
    Parametros:
        nombre_archivo (str): El nombre del archivo CSV que se debe cargar
    Retorno:
        (DataFrame) : El DataFrame con todos los datos contenidos en el archivo
    """
    nombre_archivo=pd.read_csv('exoplanetas.csv')

    return nombre_archivo

def histograma_descubrimiento(datos:pd.DataFrame)->None:
    """ Calcula y despliega un histograma con 30 grupos (bins) en el que debe
        aparecer la cantidad de planetas descubiertos por anho.
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
    """

    fig = px.histogram(datos, x='DESCUBRIMIENTO', color='DESCUBRIMIENTO')

    # Personalizar título y etiquetas de los ejes
    fig.update_layout(
        title={"text": "Cantidad de planetas descubiertos entre 1988 y 2018",
              'x': 0.5,
              'xanchor': 'center'
        },
        xaxis_title="Años",
        yaxis_title="Cantidad de planetas descubiertos"
    )

    fig.show()

def estado_publicacion_por_descubrimiento(datos:pd.DataFrame)->None:
    """ Calcula y despliega un BoxPlot donde aparecen la cantidad de planetas
        descubiertos por anho, agrupados de acuerdo con el tipo de publicacion.
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
    """

    fig = px.box(datos, x='ESTADO_PUBLICACION', y='DESCUBRIMIENTO', color='ESTADO_PUBLICACION')

    # Personalizar título y etiquetas de los ejes
    fig.update_layout(
        title={"text": "Tipo de publicación vs año de descubrimiento",
              'x': 0.5,
              'xanchor': 'center'
        },
        xaxis_title="Año de descubrimiento",
        yaxis_title="Tipo de publicación"
    )
    fig.show()

def deteccion_por_descubrimiento(datos:pd.DataFrame)->None:
    """ Calcula y despliega un BoxPlot donde aparecen la cantidad de planetas
        descubiertos por anho, agrupados de acuerdo con el tipo de deteccion
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
    """
    fig = px.box(datos, x='TIPO_DETECCION', y='DESCUBRIMIENTO', color='TIPO_DETECCION')

    # Personalizar título y etiquetas de los ejes
    fig.update_layout(
        title={"text": "Tipo de detección vs año de descubrimiento",
              'x': 0.5,
              'xanchor': 'center'
        },
        xaxis_title="Año de descubrimiento",
        yaxis_title="Tipo de detección"
    )
    fig.show()

def deteccion_y_descubrimiento(datos:pd.DataFrame,anho:int)->None:
    """ Calcula y despliega un diagrama de pie donde aparecen la cantidad de
        planetas descubiertos en un anho particular, clasificados de acuerdo
        con el tipo de publicacion.
        Si el anho es 0, se muestra la información para todos los planetas.
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
        anho (int): el anho para el que se quieren analizar los planetas descubiertos
                    o 0 para indicar que deben ser todos los planetas.
    """

    if anho==0:
        fig = px.pie(datos, names="TIPO_DETECCION")
        fig.update_layout(
        title={"text": "Tipo de detección en todos los años",
              'x': 0.5,
              'xanchor': 'center'
        })
    else:
        # Filtrar los datos para el año deseado
        datos_filtrados = datos[datos["DESCUBRIMIENTO"] == anho]
        # Crear el gráfico de pastel con los datos filtrados
        fig = px.pie(datos_filtrados, names="TIPO_DETECCION")
        fig.update_layout(
        title={"text": f"Tipo de detección en el año {anho}",
              'x': 0.5,
              'xanchor': 'center'
        })

    # Mostrar la figura
    fig.show()

def cantidad_y_tipo_deteccion(datos:pd.DataFrame)->None:
    """ Calcula y despliega un diagrama de lineas donde aparece una linea por
        cada tipo de deteccion y se muestra la cantidad de planetas descubiertos
        en cada anho, para ese tipo de deteccion.
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
    """
    por_tipo = datos.groupby("TIPO_DETECCION")
    diccionario = {}

    for tipo, grupo in por_tipo:
        serie = grupo["DESCUBRIMIENTO"].value_counts().sort_index()
        diccionario[tipo] = serie

    nuevo = pd.DataFrame(diccionario)
    fig = px.line(nuevo)

    fig.update_layout(
        title={"text": "Cantidad de planetas descubiertos según el tipo de detección",
              'x': 0.5,
              'xanchor': 'center'
        },
        xaxis_title="Año de descubrimiento",
        yaxis_title="Cantidad de planetas"
    )

    fig.show()

def masa_promedio_y_tipo_deteccion(datos:pd.DataFrame)->None:
    """ Calcula y despliega un diagrama de lineas donde aparece una linea por
        cada tipo de detección y se muestra la masa promedio de los planetas descubiertos
        en cada anho, para ese tipo de deteccion.
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
    """
    df_base = datos[["TIPO_DETECCION", "MASA", "DESCUBRIMIENTO"]].groupby("TIPO_DETECCION")

    diccionario = {}

    for tipo, grupo in df_base:
        dic = {}
        dic_2 = {}
        for i in range(len(grupo)):
            j = grupo.iloc[i]["DESCUBRIMIENTO"]
            masa = grupo.iloc[i]["MASA"]
            if j in dic:
                dic[j] += masa
                dic_2[j] += 1
            else:
                dic[j] = masa
                dic_2[j] = 1
        cantidad = [dic[j] / dic_2[j] for j in dic]
        serie = pd.Series(cantidad, index=dic.keys())
        diccionario[tipo] = serie

    nuevo = pd.DataFrame(diccionario)
    fig = px.line(nuevo)

    fig.update_layout(
            title={"text": "Masa promedio de los planetas según el tipo de detección",
                  'x': 0.5,
                  'xanchor': 'center'
            },
            xaxis_title="Año de descubrimiento",
            yaxis_title="Masa promedio"
        )

    fig.show()

def masa_planetas_vs_masa_estrellas(datos: pd.DataFrame)->None:
    """ Calcula y despliega un diagrama de dispersión donde en el eje x se
        encuentra la masa de los planetas y en el eje y se encuentra el logaritmo
        de la masa de las estrellas. Cada punto en el diagrama correspondera
        a un planeta y estara ubicado de acuerdo con su masa y la masa de la
        estrella más cercana.
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
    """
    df_base=datos[["MASA","MASA_ESTRELLA"]]
    des=df_base.plot(kind="scatter", x="MASA", y="MASA_ESTRELLA", figsize=(10,6),
                     logy=True, title="Masa de los planetas vs. masa de la estrella más cercana")
    des.set_xlabel("Masa del planeta")
    des.set_ylabel("Masa de la estrella (log)")

def graficar_cielo(datos:pd.DataFrame)->list:
    """ Calcula y despliega una imagen donde aparece un pixel por cada planeta,
        usando colores diferentes que dependen del tipo de detección utilizado
        para descubirlo.
    Parametros:
        datos (DataFrame): el DataFrame con la informacion de los exoplanetas
    Retorno:
        Una matriz de pixeles con la representacion del cielo
    """
    matriz=[]
    for j in range(0,100):
        a=[(0,0,0)]*201
        matriz.append(a)

    df_base=datos[["RA","DEC", "TIPO_DETECCION"]]
    for j in range(len(df_base["RA"])):
        f=round(abs(99-abs(np.sin(df_base.loc[j, "RA"])*np.cos(df_base.loc[j, "DEC"])*100)))
        c=round(abs((np.cos(df_base.loc[j, "RA"])*np.cos(df_base.loc[j, "DEC"])*100)+100))
        if df_base.loc[j, "TIPO_DETECCION"] == "Microlensing":
            matriz[f][c]=[0.94,0.10,0.10]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Radial Velocity":
            matriz[f][c]=[0.1,0.5,0.94]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Imaging":
            matriz[f][c]=[0.34,0.94,0.10]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Primary Transit":
            matriz[f][c]=[0.10,0.94,0.85]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Other":
            matriz[f][c]=[0.94,0.10,0.85]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Astrometry":
            matriz[f][c]=[0.94,0.65,0.10]
        elif df_base.loc[j, "TIPO_DETECCION"] == "TTV":
            matriz[f][c]=[1.0,1.0,1.0]

    plt.imshow(matriz)

def filtrar_imagen_cielo(imagen:list)->None:
    """ Le aplica a la imagen un filtro de convolucion basado en la matriz
        [[-1,-1,-1],[-1,9,-1],[-1,-1,-1]]
    Parametros:
        imagen (list): una matriz con la imagen del cielo
    """
    datos=pd.read_csv('exoplanetas.csv')

    imagen=[]
    for j in range(0,100):
        a=[(0,0,0)]*201
        imagen.append(a)

    matriz=[]
    for j in range(0,100):
        a=[(0,0,0)]*201
        matriz.append(a)

    df_base=datos[["RA","DEC", "TIPO_DETECCION"]]
    for j in range(len(df_base["RA"])):
        f=round(abs(99-abs(np.sin(df_base.loc[j, "RA"])*np.cos(df_base.loc[j, "DEC"])*100)))
        c=round(abs((np.cos(df_base.loc[j, "RA"])*np.cos(df_base.loc[j, "DEC"])*100)+100))
        if df_base.loc[j, "TIPO_DETECCION"] == "Microlensing":
            imagen[f][c]=[0.94,0.10,0.10]
            matriz[f][c]=[0.94,0.10,0.10]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Radial Velocity":
            imagen[f][c]=[0.1,0.5,0.94]
            matriz[f][c]=[0.1,0.5,0.94]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Imaging":
            imagen[f][c]=[0.34,0.94,0.10]
            matriz[f][c]=[0.34,0.94,0.10]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Primary Transit":
            imagen[f][c]=[0.10,0.94,0.85]
            matriz[f][c]=[0.10,0.94,0.85]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Other":
            imagen[f][c]=[0.94,0.10,0.85]
            matriz[f][c]=[0.94,0.10,0.85]
        elif df_base.loc[j, "TIPO_DETECCION"] == "Astrometry":
            imagen[f][c]=[0.94,0.65,0.10]
            matriz[f][c]=[0.94,0.65,0.10]
        elif df_base.loc[j, "TIPO_DETECCION"] == "TTV":
            imagen[f][c]=[1.0,1.0,1.0]
            matriz[f][c]=[1.0,1.0,1.0]

    alto=len(imagen)
    ancho=len(imagen[0])
    mascara=[[-1,-1,-1],[-1,9,-1],[-1,-1,-1]]

    for i in range(alto):
        for j in range(ancho):
            suma_colores=[0.0,0.0,0.0]
            suma_coef_mascara=0.0
            x=0
            for fila in range(i-1,i+2):
                y=0
                for columna in range(j-1,j+2):
                    if fila>=0 and fila<alto and columna>=0 and columna<ancho:
                        suma_colores[0]+=(mascara[x][y]*imagen[fila][columna][0])
                        suma_colores[1]+=(mascara[x][y]*imagen[fila][columna][1])
                        suma_colores[2]+=(mascara[x][y]*imagen[fila][columna][2])
                        suma_coef_mascara+=mascara[x][y]
                    y+=1
                x+=1
            if suma_coef_mascara!=0:
                nuevo_r=suma_colores[0]/suma_coef_mascara
                nuevo_g=suma_colores[1]/suma_coef_mascara
                nuevo_b=suma_colores[2]/suma_coef_mascara
            else:
                nuevo_r=suma_colores[0]
                nuevo_g=suma_colores[1]
                nuevo_b=suma_colores[2]

            nuevo_pixel=(nuevo_r, nuevo_g, nuevo_b)
            matriz[i][j]=nuevo_pixel

    plt.imshow(matriz)

In [None]:
#import exoplanetas as mod
import pandas as pd

def ejecutar_cargar_datos() -> pd.DataFrame:
    """
       Pide el nombre del archivo CSV que se quiere cargar y usa la funcion
       cargar_datos para construir el DataFrame.
       Retorno:
           Un DataFrame con los datos contenidos en el archivo.
    """
    nombre_archivo=input("Ingrese el nombre del archivo que desea cargar: ")
    datos=cargar_datos(nombre_archivo)
    cantidad = len(datos)
    columnas = "\n - ".join(datos.columns)
    print(f"Un archivo con {cantidad} registros fue cargado.")
    print(f"Las columnas del conjunto de datos son: \n - {columnas}")
    return datos

def ejecutar_histograma_descubrimientos (datos:pd.DataFrame)->None:
    histograma_descubrimiento(datos)

def ejecutar_estado_publicacion_por_descubrimiento(datos:pd.DataFrame)->None:
    estado_publicacion_por_descubrimiento(datos)

def ejecutar_deteccion_por_descubrimiento(datos:pd.DataFrame)->None:
    deteccion_por_descubrimiento(datos)

def ejecutar_deteccion_y_descubrimiento(datos:pd.DataFrame)->None:
    num = int(input("Ingrese el anho que quiere visualizar. Para visualizar todos los anhos ingrese 0: "))
    deteccion_y_descubrimiento(datos,num)

def ejecutar_cantidad_y_tipo_deteccion(datos:pd.DataFrame)->None:
    cantidad_y_tipo_deteccion(datos)

def ejecutar_masa_promedio_y_tipo_deteccion(datos:pd.DataFrame)->None:
    masa_promedio_y_tipo_deteccion(datos)

def ejecutar_masa_planetas_vs_masa_estrellas(datos:pd.DataFrame)->None:
    masa_planetas_vs_masa_estrellas(datos)

def ejecutar_graficar_cielo(datos:pd.DataFrame)->None:
    graficar_cielo(datos)

def ejecutar_filtrar_imagen_cielo(datos:pd.DataFrame)->None:
    imagen = graficar_cielo(datos)
    filtrar_imagen_cielo(imagen)

def menu()->None:
    print("\n\nOPCIONES")
    print("0. Cargar datos")
    print("1. Numero de descubrimientos por anho (histograma)")
    print("2. Descubrimiento por estado de publicacion (boxplot)")
    print("3. Descubrimiento por tipo de deteccion (boxplot)")
    print("4. Tipo de deteccion por anho (pie)")
    print("5. Cantidad de descubrimientos por anho según el tipo de deteccion (lineas)")
    print("6. Masa promedio por anho y por tipo de deteccion (lineas)")
    print("7. Masa de los planetas vs. masa de la estrella mas cercana")
    print("8. Graficar cielo")
    print("9. Afinar la imagen del cielo")
    print("10. Salir")

def iniciar_aplicacion()->None:
    continuar=True
    while continuar:
        menu()
        elegido=int(input("Seleccione una opcion del menu: "))
        if elegido == 0:
            datos = ejecutar_cargar_datos()
        elif elegido==1:
            ejecutar_histograma_descubrimientos(datos)
        elif elegido==2:
            ejecutar_estado_publicacion_por_descubrimiento(datos)
        elif elegido==3:
            ejecutar_deteccion_por_descubrimiento(datos)
        elif elegido==4:
            ejecutar_deteccion_y_descubrimiento(datos)
        elif elegido==5:
            ejecutar_cantidad_y_tipo_deteccion(datos)
        elif elegido==6:
            ejecutar_masa_promedio_y_tipo_deteccion(datos)
        elif elegido==7:
           ejecutar_masa_planetas_vs_masa_estrellas(datos)
        elif elegido==8:
            ejecutar_graficar_cielo(datos)
        elif elegido==9:
            ejecutar_filtrar_imagen_cielo(datos)
        elif elegido==10:
            continuar=False

        else:
            print("Seleccione una opcion del menu:")

iniciar_aplicacion()

____
# **Créditos**

- Solucionado y desarrollado por Diego Ortiz
- Proyecto extraído del curso 'Programación en Python' de la Universidad de los Andes
