Se te ha proporcionado un archivo CSV denominado calificaciones.csv que contiene las 
calificaciones de varios estudiantes en distintas materias. El archivo tiene la siguiente 
estructura: 
Nombre, Materia, Calificacion

In [1]:
# Importamos la biblioteca de readr y dplyr
# Leemos los datos del archivo calificaciones.csv y creamos un dataframe

library(dplyr)
library(readr)

df <- read_csv('../data/calificaciones.csv') 


Attaching package: ‘dplyr’


The following objects are masked from ‘package:stats’:

    filter, lag


The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union


[1mRows: [22m[34m9[39m [1mColumns: [22m[34m3[39m
[36m──[39m [1mColumn specification[22m [36m────────────────────────────────────────────────────────[39m
[1mDelimiter:[22m ","
[31mchr[39m (2): Nombre, Materia
[32mdbl[39m (1): Calificacion

[36mℹ[39m Use `spec()` to retrieve the full column specification for this data.
[36mℹ[39m Specify the column types or set `show_col_types = FALSE` to quiet this message.


In [2]:
# Mostramos el DataFrame original para revisión
cat("DataFrame original: \n")
print(df)

DataFrame original: 
[90m# A tibble: 9 × 3[39m
  Nombre  Materia     Calificacion
  [3m[90m<chr>[39m[23m   [3m[90m<chr>[39m[23m              [3m[90m<dbl>[39m[23m
[90m1[39m Alice   Matematicas           89
[90m2[39m Bob     Matematicas           92
[90m3[39m Charlie Matematicas           85
[90m4[39m Alice   Fisica                95
[90m5[39m Bob     Fisica                88
[90m6[39m Charlie Fisica                91
[90m7[39m Alice   Quimica               87
[90m8[39m Bob     Quimica               90
[90m9[39m Charlie Quimica               94


In [3]:
# Calculamos y mostramos el promedio de calificaciones por estudiante
# Agrupamos por 'Estudiante' y sacamos el promedio de 'Calificacion'
df_promedio_estudiante <- df %>%
  group_by(Nombre) %>%
  summarise(Calificacion = mean(Calificacion, na.rm = TRUE)) %>%
  ungroup()

print("Promedio por estudiante:")
print(df_promedio_estudiante)

[1] "Promedio por estudiante:"


[90m# A tibble: 3 × 2[39m
  Nombre  Calificacion
  [3m[90m<chr>[39m[23m          [3m[90m<dbl>[39m[23m
[90m1[39m Alice           90.3
[90m2[39m Bob             90  
[90m3[39m Charlie         90  


In [4]:
# Calculamos y mostramos el promedio de calificaciones por materia
# Agrupamos por 'Materia' y sacamos el promedio de 'Calificacion'

df_promedio_materia <- df %>%
  group_by(Materia) %>%
  summarise(Calificacion = mean(Calificacion, na.rm = TRUE)) %>%
  ungroup()

print("Promedio de calificaciones por materia:")
print(df_promedio_materia)

[1] "Promedio de calificaciones por materia:"
[90m# A tibble: 3 × 2[39m
  Materia     Calificacion
  [3m[90m<chr>[39m[23m              [3m[90m<dbl>[39m[23m
[90m1[39m Fisica              91.3
[90m2[39m Matematicas         88.7
[90m3[39m Quimica             90.3


In [5]:
# Filtramos el dataframe por los estudiantes que tuvieron una calificacion igual o superior a 90
# Imprimimos la lista anterior, agrupada por Nombre de estudiantes

df_estudiantes_90 <- df %>% filter(Calificacion >= 90)

cat("Estudiantes con al menos una calificacion de 90 o mas:\n")
print(unique(df_estudiantes_90$Nombre))

Estudiantes con al menos una calificacion de 90 o mas:
[1] "Bob"     "Alice"   "Charlie"


In [6]:
# Encontramos y buscamos al estudiante con la calificacion mas alta de cada materia
# Agrupamos el dataframe por materia, luego buscamos el indice del valor mas alto de las calificaciones con idmax()
# Con los indices obtenidos, buscamos estos indices en el dataframe con loc()

estudiantes_sobresalientes <- df %>%
  group_by(Materia) %>%
  slice(which.max(Calificacion))

cat("Estudiantes con la calificacion mas alta por materia:\n")
print(estudiantes_sobresalientes)

Estudiantes con la calificacion mas alta por materia:
[90m# A tibble: 3 × 3[39m
[90m# Groups:   Materia [3][39m
  Nombre  Materia     Calificacion
  [3m[90m<chr>[39m[23m   [3m[90m<chr>[39m[23m              [3m[90m<dbl>[39m[23m
[90m1[39m Alice   Fisica                95
[90m2[39m Bob     Matematicas           92
[90m3[39m Charlie Quimica               94


In [7]:
# Encontramos y buscamos la calificacion total de los estudiantes sumando sus calificaciones de cada materia

df_promedio_estudiante <- df %>%
  group_by(Nombre) %>%
  summarise(Calificacion = mean(Calificacion, na.rm = TRUE)) %>%
  ungroup()

cat("Promedio por estudiante:\n")
print(df_promedio_estudiante)

Promedio por estudiante:
[90m# A tibble: 3 × 2[39m
  Nombre  Calificacion
  [3m[90m<chr>[39m[23m          [3m[90m<dbl>[39m[23m
[90m1[39m Alice           90.3
[90m2[39m Bob             90  
[90m3[39m Charlie         90  
