# Promedio de licenciatura en aspirantes y aceptados

In [8]:
# Importamos las librerías necesarias

import pandas as pd
from plotly.subplots import make_subplots
import plotly.graph_objects as go

In [9]:
df = pd.read_csv('../data/aspirantes-mcd.csv')
anios = [i for i in range(2020,2024)]

# Estandarizamos la columna Fecha Pre-registro y 'Licenciatura: Promedio
df['Fecha Pre-registro'] = pd.to_datetime(df['Fecha Pre-registro'])
df['Licenciatura: Promedio'] = df['Licenciatura: Promedio'].str.replace(',','.')
df['Licenciatura: Promedio'] = df['Licenciatura: Promedio'].astype('float')
df = df[df['Licenciatura: Promedio']>0]

# Obtenemos además el año cuando se hizo el registro
df['Anio'] = df['Fecha Pre-registro'].dt.year


df.head()

Unnamed: 0.1,Unnamed: 0,Pais,Estado,Sexo,Estado Civil,Num Hijos,Religión,Fecha Pre-registro,Nacionalidad,Licenciatura: Institución,Licenciatura: Programa,Licenciatura: Promedio,Licenciatura: Tipo Titulación,Licenciatura: Fecha Titulación,aspirantePosgradoId,Edad,Aceptado,Anio
0,0,MÉXICO,SONORA,MUJER,CASADO(A),0,NINGUNA RELIGIÓN,2020-05-03,VERDADERO,UNIVERSIDAD ESTATAL DE SONORA,LIC. EN ADMINISTRACION DE EMPRESAS TURÍSTICAS,97.0,EXAMEN NACIONAL DE CALIDAD (CENEVAL),13/07/2012,186566,33,VERDADERO,2020.0
1,1,MÉXICO,SONORA,MUJER,CASADO(A),0,NINGUNA RELIGIÓN,2020-05-03,VERDADERO,UNIVERSIDAD DE SONORA,LIC. EN FÍSICA,93.0,POR PROMEDIO,01/07/2020,186566,33,VERDADERO,2020.0
2,2,MÉXICO,CHIHUAHUA,HOMBRE,DIVORCIADO(A),1,NINGUNA RELIGIÓN,2020-03-14,FALSO,INSTITUTO TECNOLÓGICO DE CHIHUAHUA,INGENIERÍA ELECTRÓNICA,91.0,POR PROMEDIO,10/12/1993,186616,53,FALSO,2020.0
3,3,MÉXICO,SONORA,HOMBRE,CASADO(A),1,CATÓLICA,2020-03-19,VERDADERO,UNIVERSIDAD DE SONORA,INGENIERÍA INDUSTRIAL Y DE SISTEMAS,80.7,EXAMEN NACIONAL DE CALIDAD (CENEVAL),,186645,38,VERDADERO,2020.0
4,4,MÉXICO,SONORA,HOMBRE,SOLTERO(A),0,PENTECOSTALES/EVANGÉLICAS/CRISTIANAS,2020-03-20,VERDADERO,UNIVERSIDAD DEL VALLE DE MÉXICO,LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS,90.3,EXAMEN NACIONAL DE CALIDAD (CENEVAL),16/02/2018,184078,32,VERDADERO,2020.0


In [10]:
# Ralizamos diagramas de caja comparando el promedio de licenciatura de los aspirantes contra el promedio de los estudiantes aceptados

dfaceptados = df[df['Aceptado'] == 'VERDADERO']

fig = make_subplots(
    rows=1, cols=1,
)

# Añadimos los dos diagramas: uno que representa a todos los aspirantes y otro exclusivamente para los aceptados
fig.add_trace(go.Box(y = df['Licenciatura: Promedio'], name = 'Aspirantes'))
fig.add_trace(go.Box(y = dfaceptados['Licenciatura: Promedio'], name = 'Aceptados'))

fig.update_layout(height=600, width=600, title_text=f'Promedio de licenciatura en aspirantes y aceptados histórico', title_x = 0.5)

fig.show()

In [11]:
# Repetimos el proceso anterior para cada año

for anio in anios:
    dftotal = df[df['Anio'] == anio]
    dfaceptados = dftotal[dftotal['Aceptado'] == 'VERDADERO']
    fig = make_subplots(
        rows=1, cols=1,
    )

    fig.add_trace(go.Box(y = dftotal['Licenciatura: Promedio'], name = 'Aspirantes'))
    fig.add_trace(go.Box(y = dfaceptados['Licenciatura: Promedio'], name = 'Aceptados'))

    fig.update_layout(height=600, width=600, title_text=f'Promedio de licenciatura en {anio}', title_x = 0.5)

    fig.show()

    del(dftotal)
    del(dfaceptados)