Se te ha proporcionado un archivo CSV denominado calificaciones.csv que contiene las 
calificaciones de varios estudiantes en distintas materias. El archivo tiene la siguiente 
estructura: 
Nombre, Materia, Calificacion

In [1]:
# Importamos la biblioteca de pandas
# Leemos los datos del archivo calificaciones.csv y creamos un dataframe

import pandas as pd
df = pd.read_csv('./../data/calificaciones.csv') 

In [2]:
# Mostramos el DataFrame original
print("DataFrame original:")
print(df)

DataFrame original:
    Nombre      Materia  Calificacion
0    Alice  Matematicas            89
1      Bob  Matematicas            92
2  Charlie  Matematicas            85
3    Alice       Fisica            95
4      Bob       Fisica            88
5  Charlie       Fisica            91
6    Alice      Quimica            87
7      Bob      Quimica            90
8  Charlie      Quimica            94


In [3]:
# Calculamos y mostramos el promedio de calificaciones por estudiante
# Agrupamos por 'Estudiante' y sacamos el promedio de 'Calificacion'
df_promedio_estudiante = df.groupby('Nombre')['Calificacion'].mean().reset_index()
print("Promedio por estudiante:")
print(df_promedio_estudiante)

Promedio por estudiante:
    Nombre  Calificacion
0    Alice     90.333333
1      Bob     90.000000
2  Charlie     90.000000


In [4]:
# Calculamos y mostramos el promedio de calificaciones por materia
# Agrupamos por 'Materia' y sacamos el promedio de 'Calificacion'
df_promedio_materia = df.groupby('Materia')['Calificacion'].mean().reset_index()
print("Promedio de calificaciones por materia:")
print(df_promedio_materia)

Promedio de calificaciones por materia:
       Materia  Calificacion
0       Fisica     91.333333
1  Matematicas     88.666667
2      Quimica     90.333333


In [5]:
# Filtramos el dataframe por los estudiantes que tuvieron una calificacion igual o superior a 90
# Imprimimos la lista anterior, agrupada por Nombre de estudiantes

df_estudiantes_90 = df[df['Calificacion'] >= 90]
print("Estudiantes con al menos una calificacion de 90 o mas:")
print(df_estudiantes_90['Nombre'].unique())

Estudiantes con al menos una calificacion de 90 o mas:
['Bob' 'Alice' 'Charlie']


In [6]:
# Encontramos y buscamos al estudiante con la calificacion mas alta de cada materia
# Agrupamos el dataframe por materia, luego buscamos el indice del valor mas alto de las calificaciones con idmax()
# Con los indices obtenidos, buscamos estos indices en el dataframe con loc()

indices = df.groupby('Materia')['Calificacion'].idxmax()
estudiantes_sobresalientes = df.loc[indices]
print("Estudiantes con la calificacion mas alta por materia:")
print(estudiantes_sobresalientes)

Estudiantes con la calificacion mas alta por materia:
    Nombre      Materia  Calificacion
3    Alice       Fisica            95
1      Bob  Matematicas            92
8  Charlie      Quimica            94


In [7]:
# Encontramos y buscamos la calificacion total de los estudiantes sumando sus calificaciones de cada materia

df_promedio_estudiante = df.groupby('Nombre')['Calificacion'].mean().reset_index()
print("Promedio por estudiante:")
print(df_promedio_estudiante)

Promedio por estudiante:
    Nombre  Calificacion
0    Alice     90.333333
1      Bob     90.000000
2  Charlie     90.000000
