<a href="https://colab.research.google.com/github/LuisaBeccar/ODMexamen/blob/main/VisualizacionesODM.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Requirements

In [36]:
pip install -U kaleido



In [1]:
import pandas as pd
import numpy as np
import requests
import plotly.express as px
import json
import os
import unicodedata
import kaleido



This means that static image generation (e.g. `fig.write_image()`) will not work.

Please upgrade Plotly to version 6.1.1 or greater, or downgrade Kaleido to version 0.2.1.

  from .kaleido import Kaleido


In [2]:
df = pd.read_csv("https://raw.githubusercontent.com/LuisaBeccar/ODMexamen/refs/heads/main/Base_ODM2025.csv")
df.head(2)

Unnamed: 0,DNI,NOMBRE,APELLIDO,SEXO,ORIGEN,UNI,TIPO_UNI,PAIS_UNI,CIUDAD_UNI,lat,...,PROMEDIO_CARRERA,ESPECIALIDAD,NOTA_EXAMEN,COMPONENTE,PUNTAJE,PUNTAJE_CRUDO,ODM,ODM_CRUDO,ODM_GLOBAL,ODM_GLOBAL_CRUDO
0,42011937,NATALIA BELEN,BARROS QUINTEROS,F,arg,UNIVERSIDAD DE BUENOS AIRES,N,Argentina,Buenos Aires,-34.6037,...,9.07,Pediatría y pediátricas articuladas,93,5,60.57,55.57,1,1,1,1
1,43418248,EUGENIA LOURDES,REJON COCUZZA,F,arg,UNIVERSIDAD NACIONAL DE CUYO,N,Argentina,Mendoza,-32.8895,...,9.19,Clínica médica,92,5,60.19,55.19,1,1,2,2


# Visualizacion

In [8]:
especialidades = df['ESPECIALIDAD'].unique()
especialidades

array(['Pediatría y pediátricas articuladas', 'Clínica médica',
       'Neurocirugía', 'Cirugía infantil (cirugía pediátrica)',
       'Tocoginecología', 'Cirugía general', 'Anestesiología',
       'Gastroenterología', 'Ortopedia y traumatología', 'Dermatología',
       'Cardiología', 'Oftalmología', 'Neumonología',
       'Cirugía cardiovascular',
       'Medicina general y/o medicina de familia', 'Urología',
       'Psiquiatría', 'Diagnóstico por imágenes', 'Neurología',
       'Endocrinología', 'Otorrinolaringología', 'Hematología',
       'Terapia intensiva', 'Oncología', 'Anatomía patológica',
       'Emergentología', 'Infectología', 'Genética médica',
       'Alergia e inmunología', 'Reumatología', 'Neurocirugía Pediátrica',
       'Nefrología', 'Cirugía cardiovascular pediátrica',
       'Ortopedia y traumatología infantil',
       'Fisiatría (medicina física y rehabilitación)', 'Cirugía de tórax',
       'Inmunología', 'Radioterapia o terapia radiante', 'Geriatría',
       'Tox

# funciones

## funcion grafico_odms

In [31]:
# df.info()
# chequeo que todos los odm son int

In [9]:
def grafico_odms(especialidad):
    df_esp = df[df['ESPECIALIDAD'] == especialidad].copy()

    # Ordenar por ODM y asignar orden de mérito para cada variable
    df_odm = df_esp.sort_values('ODM').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm)+1)
    df_odm['Variable'] = 'ODM'

    df_crudo = df_esp.sort_values('ODM_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo)+1)
    df_crudo['Variable'] = 'ODM_CRUDO'

    df_long = pd.concat([df_odm, df_crudo], ignore_index=True)

    # Para gráfico de barras horizontales con facet col para las dos variables
    fig = px.bar(df_long,
                 x=[1]*len(df_long),  # Barras del mismo ancho
                 y='Orden',
                 color='TIPO_UNI',
                 orientation='h',
                 facet_col='Variable',
                 color_discrete_map={'N': 'lightskyblue', 'E': 'red'},
                 category_orders={'':['ODM', 'ODM_CRUDO']},
                 labels={'Orden': 'Orden de mérito', 'TIPO_UNI': 'Tipo de universidad'},
                 height=400,
                 width=400)

    fig.update_traces(marker_line_width=0, textfont_size=8)
    fig.update_yaxes(autorange='reversed')
    fig.update_layout(title={ 'text': f"{especialidad}: <span style='font-size:12px;'>{len(df_esp)} postulantes</span><br>",
                      'x': 0,'xanchor': 'left', 'y': 0.95, 'yanchor': 'top','pad': {'b': 20, 't': 10}, })

    fig.update_xaxes(showticklabels=False, title=None)
    fig.for_each_annotation(lambda a: a.update(text=a.text.split('=')[-1]))

    fig.update_traces(hoverinfo='skip', hovertemplate=None)

    fig.show()

## funcion seleccionar_especialidad

In [33]:
def seleccionar_especialidad():
    print("Seleccione el numero de la especialidad que desea evaluar:")
    for i, especialidad in enumerate(especialidades, 1):
        print(f"{i}: {especialidad}")

    while True:
        opcion = input("Ingrese el número de la especialidad: ")
        if opcion.isdigit():
            opcion_int = int(opcion)
            if 1 <= opcion_int <= len(especialidades):
                print(f"Ha seleccionado: {especialidades[opcion_int - 1]}")
                return especialidades[opcion_int - 1]
            else:
                print("Número fuera de rango. Intente de nuevo.")
        else:
            print("Entrada no válida. Por favor, ingrese un número.")


# main

## seleccionando la especialidad

In [38]:
"""
a = seleccionar_especialidad()
grafico_odms(a)
"""

'\na = seleccionar_especialidad()\ngrafico_odms(a)\n'

## todas o top n

In [39]:
# calcular la cantidad de postulantes por especialidad
for especialidad in especialidades:
    df_esp = df[df['ESPECIALIDAD'] == especialidad].copy()
    postulantes = len(df_esp)
    print(f'{especialidad}: nro de postulantes: {postulantes}')

Pediatría y pediátricas articuladas: nro de postulantes: 470
Clínica médica: nro de postulantes: 285
Neurocirugía: nro de postulantes: 170
Cirugía infantil (cirugía pediátrica): nro de postulantes: 54
Tocoginecología: nro de postulantes: 476
Cirugía general: nro de postulantes: 668
Anestesiología: nro de postulantes: 591
Gastroenterología: nro de postulantes: 125
Ortopedia y traumatología: nro de postulantes: 464
Dermatología: nro de postulantes: 330
Cardiología: nro de postulantes: 358
Oftalmología: nro de postulantes: 321
Neumonología: nro de postulantes: 38
Cirugía cardiovascular: nro de postulantes: 49
Medicina general y/o medicina de familia: nro de postulantes: 101
Urología: nro de postulantes: 151
Psiquiatría: nro de postulantes: 274
Diagnóstico por imágenes: nro de postulantes: 371
Neurología: nro de postulantes: 104
Endocrinología: nro de postulantes: 77
Otorrinolaringología: nro de postulantes: 254
Hematología: nro de postulantes: 26
Terapia intensiva: nro de postulantes: 85


In [40]:
# conteo de postulantes pero top 12 (para llenar hoja con 3 filas 4 columnas)
conteo_postulantes = df.groupby('ESPECIALIDAD').size().sort_values(ascending=False).head(12)
top12 = []
print("Cantidad de postulantes por especialidad - Top 12: \n")
for especialidad, cantidad in conteo_postulantes.items():
    top12.append((especialidad))
    print(f" {especialidad}: {cantidad}")


Cantidad de postulantes por especialidad - Top 12: 

 Cirugía general: 668
 Anestesiología: 591
 Tocoginecología: 476
 Pediatría y pediátricas articuladas: 470
 Ortopedia y traumatología: 464
 Diagnóstico por imágenes: 371
 Cardiología: 358
 Dermatología: 330
 Oftalmología: 321
 Clínica médica: 285
 Psiquiatría: 274
 Otorrinolaringología: 254


In [10]:
for especialidad in especialidades: # o poner top12
    grafico_odms(especialidad)

## Obteniendo oferta de cargos

De
[esta pagina del gobierno](https://www.argentina.gob.ar/salud/residencias/ingreso/oferta-de-cargos)
saco el [json](https://sheets.googleapis.com/v4/spreadsheets/1MuhaLJOG9fmimJtPcYMO5rHJQp2cltJnCMDKl8jxvBk/values/3.%20oferta_cargos?key=AIzaSyCq2wEEKL9-6RmX-TkW23qJsrmnFHFf5tY&alt=json) que tras filtrar, agrupar y sumar, obtendré la cantidad de cargos ofrecidos por especialidad


In [None]:
# uniformar las especialidades para que esten en mayusculas y sin tildes como en el json
import unicodedata

def quitar_tildes(texto):
    return ''.join(
        c for c in unicodedata.normalize('NFD', texto)
        if unicodedata.category(c) != 'Mn')
# Crear nueva lista sin tildes
especialidadesUp = [quitar_tildes(e).upper() for e in especialidades]
print(especialidadesUp)


In [None]:
import pandas as pd
import json

def procesar_oferta_cargos(nombre_archivo, especialidades):
    with open(nombre_archivo, "r", encoding="utf-8") as f:
        data = json.load(f)
    rows = data["values"]
    headers = rows[0]
    records = rows[2:]
    fixed_records = [r + [""] * (len(headers) - len(r)) for r in records]
    df = pd.DataFrame(fixed_records, columns=headers)
    numeric_cols = ["basica", "posbasica", "concurrencia"]
    df[numeric_cols] = df[numeric_cols].apply(pd.to_numeric, errors="coerce").fillna(0).astype(int)
    df = df[["filtro-concurso", "filtro-especialidad", "basica"]]
    nombreCols = ["concurso", "especialidad", "oferta"]
    df.columns = nombreCols
    df_examenU = df[df['concurso'] == 'CONCURSO UNIFICADO']
    df_examenU = df_examenU[df_examenU["especialidad"].str.upper().isin(especialidades)]
    cargos_por_especialidad = df_examenU.groupby("especialidad")['oferta'].sum().reset_index()
    cargos_por_especialidad = cargos_por_especialidad[cargos_por_especialidad["oferta"] > 0]
    cargos_por_especialidad = cargos_por_especialidad.sort_values(by="especialidad")
    return cargos_por_especialidad


In [None]:
txt_url = "https://raw.githubusercontent.com/LuisaBeccar/ODMexamen/refs/heads/main/generar_data/oferta_cargos.txt"

# Aquí asumes que procesar_oferta_cargos espera un string que es la ruta o URL del archivo
oferta_cargosU = procesar_oferta_cargos(txt_url, especialidadesUp)
print(oferta_cargosU)


## hacerle la linea de oferta


In [None]:
def grafico_odms2(especialidad):
    df_esp = df[df['ESPECIALIDAD'] == especialidad].copy()

    # Ordenar por ODM y asignar orden de mérito para cada variable
    df_odm = df_esp.sort_values('ODM').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm)+1)
    df_odm['Variable'] = 'ODM'

    df_crudo = df_esp.sort_values('ODM_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo)+1)
    df_crudo['Variable'] = 'ODM_CRUDO'

    df_long = pd.concat([df_odm, df_crudo], ignore_index=True)

    # Para gráfico de barras horizontales con facet col para las dos variables
    fig = px.bar(df_long,
                 x=[1]*len(df_long),  # Barras del mismo ancho
                 y='Orden',
                 color='TIPO_UNI',
                 orientation='h',
                 facet_col='Variable',
                 color_discrete_map={'N': 'lightskyblue', 'E': 'red'},
                 category_orders={'':['ODM', 'ODM_CRUDO']},
                 labels={'Orden': 'Orden de mérito', 'TIPO_UNI': 'Tipo de universidad'},
                 height=400,
                 width=400)

    # Sacar la oferta para la especialidad
    oferta = oferta_cargosU.loc[oferta_cargosU['especialidad'] == especialidad, 'oferta'].values
    if len(oferta) > 0:
        oferta_val = oferta[0]
        for idx, var in enumerate(['ODM', 'ODM_CRUDO'], start=1):
            fig.add_shape(type="line",
                           x0=0,
                           x1=1,
                           xref="paper",   # barra a lo ancho de la faceta
                           y0=oferta_val,
                           y1=oferta_val,
                           yref=f'y{idx}',  # Asegúrate de que esto sea correcto
                           line=dict(color="black", width=4, dash="dashdot"),
                          )

    # Actualizar trazas y ejes
    fig.update_traces(marker_line_width=0, textfont_size=8)
    fig.update_yaxes(autorange='reversed')
    fig.update_layout(title={ 'text': f"{especialidad}: <span style='font-size:12px;'>{len(df_esp)} postulantes</span><br>",
                              'x': 0, 'xanchor': 'left', 'y': 0.95, 'yanchor': 'top', 'pad': {'b': 20, 't': 10}, })

    fig.update_xaxes(showticklabels=False, title=None)
    fig.for_each_annotation(lambda a: a.update(text=a.text.split('=')[-1]))
    fig.update_yaxes(range=[100, 500])
    fig.update_traces(hoverinfo='skip', hovertemplate=None)

    fig.show()



# BARRA GLOBAL Y GLOBAL CRUDO

In [None]:
import pandas as pd
import numpy as np
import plotly.express as px

def graficoGLOBAL(df, especialidad=None):
    # Si quieres filtrar por especialidad, descomenta la línea siguiente
    # if especialidad is not None:
    #     df = df[df['ESPECIALIDAD'] == especialidad].copy()

    df_odm = df.sort_values('ODM_GLOBAL').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm) + 1)
    df_odm['Variable'] = 'ODM_GLOBAL'

    df_crudo = df.sort_values('ODM_GLOBAL_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo) + 1)
    df_crudo['Variable'] = 'ODM_GLOBAL_CRUDO'

    df_long = pd.concat([df_odm, df_crudo], ignore_index=True)

    fig = px.bar(df_long,
                 x=[1] * len(df_long),
                 y='Orden',
                 color='TIPO_UNI',
                 orientation='h',
                 facet_col='Variable',
                 barmode='group',
                 color_discrete_map={'N': 'lightskyblue', 'E': 'red'},
                 labels={'Orden': 'Orden de mérito', 'TIPO_UNI': 'Tipo de universidad'},
                 height=400,
                 width=900,
                )

    fig.update_traces(marker_line_width=0, textfont_size=8)
    fig.update_yaxes(autorange='reversed')
    titulo = f"TOTAL DE POSTULANTES: {len(df)}"
    if especialidad:
        titulo = f"{especialidad}: {len(df)} postulantes"
    fig.update_layout(title={'text': titulo,
                             'x': 0, 'xanchor': 'left',
                             'y': 0.95, 'yanchor': 'top',
                             'pad': {'b': 25, 't': -5}})

    fig.update_xaxes(showticklabels=False, title=None)
    fig.for_each_annotation(lambda a: a.update(text=a.text.split('=')[-1]))
    fig.update_traces(hoverinfo='skip', hovertemplate=None)

    fig.show()


In [None]:
def graficoGLOBAL(df, especialidad=None):

    # Ordenar por ODM y asignar orden de mérito para cada variable
    df_odm = df.sort_values('ODM_GLOBAL').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm)+1)
    df_odm['Variable'] = 'ODM_GLOBAL'

    df_crudo = df.sort_values('ODM_GLOBAL_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo)+1)
    df_crudo['Variable'] = 'ODM_GLOBAL_CRUDO'

    df_long = pd.concat([df_odm, df_crudo], ignore_index=True)

    # Para gráfico de barras horizontales con facet col para las dos variables
    fig = px.bar(df_long,
                 x=[1]*len(df_long),  # Barras del mismo ancho
                 y='Orden',
                 color='TIPO_UNI',
                 orientation='h',
                 facet_col='Variable',
                 color_discrete_map={'N': 'lightskyblue', 'E': 'red'},
                 category_orders={'':['ODM', 'ODM_CRUDO']},
                 labels={'Orden': 'Orden de mérito', 'TIPO_UNI': 'Tipo de universidad'},
                 height=400,
                 width=400)

    fig.update_traces(marker_line_width=0, textfont_size=8)
    fig.update_yaxes(autorange='reversed')
    fig.update_layout(title={ 'text': f"{especialidad}: <span style='font-size:12px;'>{len(df_esp)} postulantes</span><br>",
                      'x': 0,'xanchor': 'left', 'y': 0.95, 'yanchor': 'top','pad': {'b': 20, 't': 10}, })

    fig.update_xaxes(showticklabels=False, title=None)
    fig.for_each_annotation(lambda a: a.update(text=a.text.split('=')[-1]))

    fig.update_traces(hoverinfo='skip', hovertemplate=None)
    fig.show()

In [None]:
globales = graficoGLOBAL(df)
globales