# Desafío - Tipos y estructuras de Datos (Parte II)

 1. Crea un DataFrame con el archivo entregado.

In [None]:
import pandas as pd

# Ruta al archivo en Colab
file_path = '/content/resumen_resultados_astronautas.csv'

# Cargar el archivo CSV
df = pd.read_csv(file_path)

# Verificamos que se cargaron los datos
df.head()

Unnamed: 0,nombre,edad,peso,altura,evaluacion_fisica,evaluacion_psicologica,evaluacion_adaptativa,evaluacion_medica,anos_experiencia,califica
0,Alana Morillo,32,75,180,93,88,78,89,6,Si
1,Fátima Tafalla,27,68,167,82,95,81,87,4,Si
2,Sofía Puig,29,80,185,85,80,90,91,3,Si
3,Valentina Tasis,30,65,175,90,91,85,92,2,No
4,Regina Cicerón,31,76,183,89,87,83,90,7,Si


2. Crea la columna "IMC" usando la fórmula entregada.

In [None]:
import pandas as pd

# Cargar el archivo CSV (asegúrate de que el archivo ya esté subido)
# df = pd.read_csv('resumen_resultados_astronautas.csv')

# Calcular el IMC, note que la altura en el df original está en cm y se debe llevar a metros
df['IMC'] = df['peso'] / ((df['altura']/100) ** 2)

# Mostrar las primeras filas del DataFrame con la nueva columna IMC
print("Primeras filas del DataFrame con la columna IMC:")
print(df[['peso', 'altura', 'IMC']].head())

Primeras filas del DataFrame con la columna IMC:
   peso  altura        IMC
0    75     180  23.148148
1    68     167  24.382373
2    80     185  23.374726
3    65     175  21.224490
4    76     183  22.694019


3. Crea la columna "promedio_evaluaciones" con el promedio de las 4 columnas
de evaluaciones. Si el IMC está entre 18.5 y 24.9, entonces el candidato
tendrá un IMC adecuado para ser astronauta. Filtra el DataFrame para
obtener solo aquellas filas donde el IMC esté dentro de los límites
entregados.

In [None]:
# Calcular el promedio de las 4 columnas de evaluaciones
df['promedio_evaluaciones'] = df[['evaluacion_fisica', 'evaluacion_psicologica', 'evaluacion_adaptativa', 'evaluacion_medica']].mean(axis=1)

# Filtrar el DataFrame para obtener solo aquellas filas donde el IMC esté entre 18.5 y 24.9
df_filtrado = df[(df['IMC'] >= 18.5) & (df['IMC'] <= 24.9)]

# Mostrar las primeras filas del DataFrame filtrado
print("Filas donde el IMC está entre 18.5 y 24.9:")
print(df_filtrado[['peso', 'altura', 'IMC', 'promedio_evaluaciones']].head())


Filas donde el IMC está entre 18.5 y 24.9:
   peso  altura        IMC  promedio_evaluaciones
0    75     180  23.148148                  87.00
1    68     167  24.382373                  86.25
2    80     185  23.374726                  86.50
3    65     175  21.224490                  89.50
4    76     183  22.694019                  87.25


4. El promedio de las 4 evaluaciones debe ser mayor o igual a 87. Filtra el
DataFrame resultante y agrega esta condición al filtro aplicado en el paso
anterior.

In [None]:
# Filtrar el DataFrame para obtener solo aquellas filas donde el IMC esté entre 18.5 y 24.9
# y el promedio de evaluaciones sea mayor o igual a 87
df_filtrado = df[(df['IMC'] >= 18.5) & (df['IMC'] <= 24.9) & (df['promedio_evaluaciones'] >= 87)]

# Reiniciar el índice del DataFrame filtrado
df_filtrado.reset_index(drop=True, inplace=True)# Mostrar las primeras filas del DataFrame filtrado
print("Filas donde el IMC está entre 18.5 y 24.9 y el promedio de evaluaciones es mayor o igual a 87:")
print(df_filtrado[['peso', 'altura', 'IMC', 'promedio_evaluaciones']].head())

Filas donde el IMC está entre 18.5 y 24.9 y el promedio de evaluaciones es mayor o igual a 87:
   peso  altura        IMC  promedio_evaluaciones
0    75     180  23.148148                  87.00
1    65     175  21.224490                  89.50
2    76     183  22.694019                  87.25
3    78     182  23.547881                  88.00
4    77     188  21.785876                  89.75


5. Reinicia el índice del DataFrame resultante.

In [None]:
# Reiniciar el índice del DataFrame filtrado
df_filtrado.reset_index(drop=True, inplace=True)

# Mostrar las primeras filas del DataFrame filtrado con el índice reiniciado
print("Filas donde el IMC está entre 18.5 y 24.9 y el promedio de evaluaciones es mayor o igual a 87 (índice reiniciado):")
print(df_filtrado[['peso', 'altura', 'IMC', 'promedio_evaluaciones']].head())

Filas donde el IMC está entre 18.5 y 24.9 y el promedio de evaluaciones es mayor o igual a 87 (índice reiniciado):
   peso  altura        IMC  promedio_evaluaciones
0    75     180  23.148148                  87.00
1    65     175  21.224490                  89.50
2    76     183  22.694019                  87.25
3    78     182  23.547881                  88.00
4    77     188  21.785876                  89.75


6. Modifica el valor de la columna"califica", para que diga "Si" en todas las filas del
DataFrame resultante.

In [None]:
# Modificar la columna "califica" para que diga "Si" en todas las filas
df_filtrado.loc[:, 'califica'] = 'Si'

# Mostrar las primeras filas del DataFrame resultante
print("Filas del DataFrame con la columna 'califica' modificada:")
print(df_filtrado[['peso', 'altura', 'IMC', 'promedio_evaluaciones', 'califica']].head())




Filas del DataFrame con la columna 'califica' modificada:
   peso  altura        IMC  promedio_evaluaciones califica
0    75     180  23.148148                  87.00       Si
1    65     175  21.224490                  89.50       Si
2    76     183  22.694019                  87.25       Si
3    78     182  23.547881                  88.00       Si
4    77     188  21.785876                  89.75       Si


7. Exporta el DataFrame resultante a un archivo .csv separado por comas con el
nombre "astronautas_calificados.csv".

In [None]:
# Exportar el DataFrame resultante a un archivo CSV
df_filtrado.to_csv('astronautas_calificados.csv', index=False)

print("El DataFrame ha sido exportado a 'astronautas_calificados.csv'.")

El DataFrame ha sido exportado a 'astronautas_calificados.csv'.
