<a href="https://colab.research.google.com/github/LuisaBeccar/ODMexamen/blob/main/VisualizacionesODM.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Requirements

In [27]:
import pandas as pd
import numpy as np
import requests
import plotly.express as px
import json
import os
import plotly.graph_objects as go # Necesario para configuraciones más avanzadas si px.scatter no es suficiente
import unicodedata

In [25]:
df = pd.read_csv("https://raw.githubusercontent.com/LuisaBeccar/ODMexamen/refs/heads/main/Base_ODM2025.csv")
df.head(2)

Unnamed: 0,DNI,NOMBRE,APELLIDO,SEXO,ORIGEN,UNI,TIPO_UNI,PAIS_UNI,CIUDAD_UNI,lat,...,PROMEDIO_CARRERA,ESPECIALIDAD,NOTA_EXAMEN,COMPONENTE,PUNTAJE,PUNTAJE_CRUDO,ODM,ODM_CRUDO,ODM_GLOBAL,ODM_GLOBAL_CRUDO
0,42011937,NATALIA BELEN,BARROS QUINTEROS,F,arg,UNIVERSIDAD DE BUENOS AIRES,N,Argentina,Buenos Aires,-34.6037,...,9.07,Pediatría y pediátricas articuladas,93,5,60.57,55.57,1,1,1,1
1,43418248,EUGENIA LOURDES,REJON COCUZZA,F,arg,UNIVERSIDAD NACIONAL DE CUYO,N,Argentina,Mendoza,-32.8895,...,9.19,Clínica médica,92,5,60.19,55.19,1,1,2,2


# Visualizacion

In [26]:
especialidades = df['ESPECIALIDAD'].unique()
especialidades

array(['Pediatría y pediátricas articuladas', 'Clínica médica',
       'Neurocirugía', 'Cirugía infantil (cirugía pediátrica)',
       'Tocoginecología', 'Cirugía general', 'Anestesiología',
       'Gastroenterología', 'Ortopedia y traumatología', 'Dermatología',
       'Cardiología', 'Oftalmología', 'Neumonología',
       'Cirugía cardiovascular',
       'Medicina general y/o medicina de familia', 'Urología',
       'Psiquiatría', 'Diagnóstico por imágenes', 'Neurología',
       'Endocrinología', 'Otorrinolaringología', 'Hematología',
       'Terapia intensiva', 'Oncología', 'Anatomía patológica',
       'Emergentología', 'Infectología', 'Genética médica',
       'Alergia e inmunología', 'Reumatología', 'Neurocirugía Pediátrica',
       'Nefrología', 'Cirugía cardiovascular pediátrica',
       'Ortopedia y traumatología infantil',
       'Fisiatría (medicina física y rehabilitación)', 'Cirugía de tórax',
       'Inmunología', 'Radioterapia o terapia radiante', 'Geriatría',
       'Tox

# funciones

## funcion GLOBAL

In [66]:
def GLOBAL(df):
    df_esp = df.copy()

    df_ext = df_esp.sort_values('TIPO_UNI', ascending=False).reset_index(drop=True)
    df_ext['Orden'] = np.arange(1, len(df_ext)+1)
    df_ext['Variable'] = 'TIPO_UNI'

    # Crear los DataFrames ordenados
    df_ext = df_esp.sort_values('TIPO_UNI', ascending=False).reset_index(drop=True)
    df_ext['Orden'] = np.arange(1, len(df_ext)+1)
    df_ext['Variable'] = 'EXTREMO'

    df_odm = df_esp.sort_values('ODM_GLOBAL').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm)+1)
    df_odm['Variable'] = 'ODM_GLOBAL'

    df_crudo = df_esp.sort_values('ODM_GLOBAL_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo)+1)
    df_crudo['Variable'] = 'ODM_GLOBAL_CRUDO'

    df_long = pd.concat([df_crudo, df_odm, df_ext], ignore_index=True)


    # Para gráfico de barras horizontales con facet_col
    fig = px.bar(df_long,
                 x=[1]*len(df_long),
                 y='Orden',
                 color='TIPO_UNI',
                 orientation='h',
                 facet_col='Variable',
                 color_discrete_map={'N': 'lightskyblue', 'E': 'red'},
                 category_orders={'':['ODM_GLOBAL_CRUDO','ODM_GLOBAL','EXTREMO']},
                 labels={'Orden': 'Orden de mérito', 'TIPO_UNI': 'Tipo de universidad'},
                 height=3000,
                 width=600)

    #
    fig.update_layout(annotations=[dict(
        text=f"{len(df_esp)} postulantes",
        x=0.5, y=0, xref='paper', yref='paper', showarrow=False,
        font=dict(size=12), xanchor='center', yanchor='top')])

    fig.update_traces(marker_line_width=0, textfont_size=8)
    fig.update_yaxes(autorange='reversed', tickmode='array', tickvals=[1, 150, 500, 1500, 3000, 6000])
    fig.update_yaxes(tickfont=dict(size=8))

    fig.update_layout(title={'text': "ORDEN DE MERITO GLOBAL",
                             'x': 0, 'xanchor': 'left',
                             'y': 1, 'yanchor': 'top',
                             'pad': {'b': 2, 't': 5}},
                     showlegend=True)

    fig.add_annotation(text="ODM_CRUDO", xref="paper", yref="paper", x=0.09, y=1.005, showarrow=False, font=dict(size=8))
    fig.add_annotation(text="ODM", xref="paper", yref="paper", x=0.49, y=1.005, showarrow=False, font=dict(size=10))
    fig.add_annotation(text="EXTREMO", xref="paper", yref="paper", x=0.89, y=1.005, showarrow=False, font=dict(size=8))

    fig.update_xaxes(title="", showticklabels=False)

    # --- Cálculo para el indicador ---
    df_M = df.copy()
    df_M['ID_POSTULANTE'] = df_M.index

    df_extM = df_M.sort_values('TIPO_UNI', ascending=False).reset_index(drop=True)
    df_extM['Orden'] = np.arange(1, len(df_extM) + 1)

    df_odmM = df_M.sort_values('ODM_GLOBAL').reset_index(drop=True)
    df_odmM['Orden'] = np.arange(1, len(df_odmM) + 1)

    df_crudoM = df_M.sort_values('ODM_GLOBAL_CRUDO').reset_index(drop=True)
    df_crudoM['Orden'] = np.arange(1, len(df_crudoM) + 1)

    df_mergedM = pd.merge(df_odmM, df_crudoM, on='ID_POSTULANTE', suffixes=('_odm', '_crudo'))
    df_mergedM = pd.merge(df_mergedM, df_extM.rename(columns={'Orden': 'Orden_extremo'}), on='ID_POSTULANTE')

    cambio_odm = (df_mergedM['Orden_odm'] - df_mergedM['Orden_crudo']).abs().sum()
    cambio_extremo = (df_mergedM['Orden_extremo'] - df_mergedM['Orden_crudo']).abs().sum()

    if cambio_extremo > 0:
        indicador_cambio = (cambio_odm / cambio_extremo) * 100
    else:
        indicador_cambio = 0

    fig.add_annotation(text=f"Impacto de reorden: {indicador_cambio:.2f}%",
                       xref="paper", yref="paper", x=0.5, y=-0.1,
                       showarrow=False,
                       font=dict(family="Arial", size=12, color="black"),
                       xanchor='center',
                       yanchor='middle')

    fig.update_traces(hoverinfo='skip', hovertemplate=None)
    fig.show()


In [67]:
GLOBAL(df)

## indicador de cambio


In [None]:
import pandas as pd
import numpy as np

def calcular_indicador_de_cambio(df, especialidad):
    # Filtrar el DataFrame por especialidad
    df_esp = df[df['ESPECIALIDAD'] == especialidad].copy()

    # Asegurarse de tener un ID único para cada postulante
    df_esp['ID_POSTULANTE'] = df_esp.index

    # Crear los DataFrames ordenados
    df_ext = df_esp.sort_values('TIPO_UNI', ascending=False).reset_index(drop=True)
    df_ext['Orden'] = np.arange(1, len(df_ext) + 1)

    df_odm = df_esp.sort_values('ODM').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm) + 1)

    df_crudo = df_esp.sort_values('ODM_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo) + 1)

    # Unir los DataFrames para comparar las posiciones de cada postulante
    df_merged = pd.merge(df_odm, df_crudo, on='ID_POSTULANTE', suffixes=('_odm', '_crudo'))
    df_merged = pd.merge(df_merged, df_ext.rename(columns={'Orden': 'Orden_extremo'}), on='ID_POSTULANTE')

    # Calcular la suma de las diferencias absolutas en el orden de mérito
    cambio_odm = (df_merged['Orden_odm'] - df_merged['Orden_crudo']).abs().sum()
    cambio_extremo = (df_merged['Orden_extremo'] - df_merged['Orden_crudo']).abs().sum()

    # Calcular el indicador de cambio como un porcentaje
    if cambio_extremo > 0:
        indicador_cambio = (cambio_odm / cambio_extremo) * 100
    else:
        indicador_cambio = 0

    return indicador_cambio

## funcion seleccionar_especialidad

In [None]:
def seleccionar_especialidad():
    print("Seleccione el numero de la especialidad que desea evaluar:")
    for i, especialidad in enumerate(especialidades, 1):
        print(f"{i}: {especialidad}")

    while True:
        opcion = input("Ingrese el número de la especialidad: ")
        if opcion.isdigit():
            opcion_int = int(opcion)
            if 1 <= opcion_int <= len(especialidades):
                print(f"Ha seleccionado: {especialidades[opcion_int - 1]}")
                return especialidades[opcion_int - 1]
            else:
                print("Número fuera de rango. Intente de nuevo.")
        else:
            print("Entrada no válida. Por favor, ingrese un número.")


# main

# ULTIMATE triple con medida de impacto incluida
- funcion tripleMEDIDA
- llamada en loop especialidades

In [68]:
# ULTIMATE con medida

def tripleMEDIDA(especialidad):
    df_esp = df[df['ESPECIALIDAD'] == especialidad].copy()

    df_ext = df_esp.sort_values('TIPO_UNI', ascending=False).reset_index(drop=True)
    df_ext['Orden'] = np.arange(1, len(df_ext)+1)
    df_ext['Variable'] = 'TIPO_UNI'

    # Ordenar por ODM y asignar orden de mérito para cada variable
    df_odm = df_esp.sort_values('ODM').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm)+1)
    df_odm['Variable'] = 'ODM'

    df_crudo = df_esp.sort_values('ODM_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo)+1)
    df_crudo['Variable'] = 'ODM_CRUDO'

    df_long = pd.concat([df_crudo, df_odm, df_ext ], ignore_index=True)

    # Para gráfico de barras horizontales con facet col para las dos variables
    fig = px.bar(df_long,
                 x=[1]*len(df_long),  # Barras del mismo ancho
                 y='Orden',
                 color='TIPO_UNI',
                 orientation='h',
                 facet_col='Variable',
                 color_discrete_map={'N': 'lightskyblue', 'E': 'red'},
                 category_orders={'':['ODM_CRUDO','ODM','EXTREMO' ]},
                 labels={'Orden': 'Orden de mérito', 'TIPO_UNI': 'Tipo de universidad'},
                 height=400,
                 width=400)

    fig.update_layout(annotations=[dict( # para poner el nro de postulantes de la especialidad abajo de las barras
                                        text=f"{len(df_esp)} postulantes",
                                        x=0.5,  # centro horizontal sobre la figura (de 0 a 1)
                                        y=0,  # posición vertical debajo de todo el gráfico
                                        xref='paper',
                                        yref='paper',
                                        showarrow=False,
                                        font=dict(size=12),
                                        xanchor='center',
                                        yanchor='top')])

    fig.update_traces(marker_line_width=0, textfont_size=8)
    fig.update_yaxes(autorange='reversed', tickmode='array',tickvals=[1,25, 100, 250, 500])
    fig.update_yaxes(tickfont=dict(size=8))

    fig.update_layout(title={'text': f"{especialidad}",
                             'x': 0, 'xanchor': 'left',
                             'y': 0.95, 'yanchor': 'top',
                             'pad': {'b': 20, 't': 5}},
                     showlegend=False)

    fig.add_annotation(text="ODM_CRUDO", xref="paper", yref="paper", x=0.06, y=1.05, showarrow=False, font=dict(size=7))
    fig.add_annotation(text="ODM", xref="paper", yref="paper", x=0.49, y=1.05, showarrow=False, font=dict(size=8))
    fig.add_annotation(text="EXTREMO", xref="paper", yref="paper", x=0.93, y=1.05, showarrow=False, font=dict(size=7))


    #---------------
    # Primero, calcula el indicador de cambio.
    # Filtrar el DataFrame por especialidad
    df_M = df[df['ESPECIALIDAD'] == especialidad].copy()
    df_M['ID_POSTULANTE'] = df_M.index

    # Crear los DataFrames ordenados
    df_extM = df_M.sort_values('TIPO_UNI', ascending=False).reset_index(drop=True)
    df_extM['Orden'] = np.arange(1, len(df_extM) + 1)

    df_odmM = df_M.sort_values('ODM').reset_index(drop=True)
    df_odmM['Orden'] = np.arange(1, len(df_odmM) + 1)

    df_crudoM = df_M.sort_values('ODM_CRUDO').reset_index(drop=True)
    df_crudoM['Orden'] = np.arange(1, len(df_crudoM) + 1)

    # Unir los DataFrames para comparar las posiciones de cada postulante
    df_mergedM = pd.merge(df_odmM, df_crudoM, on='ID_POSTULANTE', suffixes=('_odm', '_crudo'))
    df_mergedM = pd.merge(df_mergedM, df_extM.rename(columns={'Orden': 'Orden_extremo'}), on='ID_POSTULANTE')

    # Calcular la suma de las diferencias absolutas en el orden de mérito
    cambio_odm = (df_mergedM['Orden_odm'] - df_mergedM['Orden_crudo']).abs().sum()
    cambio_extremo = (df_mergedM['Orden_extremo'] - df_mergedM['Orden_crudo']).abs().sum()

    # Calcular el indicador de cambio como un porcentaje
    if cambio_extremo > 0:
        indicador_cambio = (cambio_odm / cambio_extremo) * 100
    else:
        indicador_cambio = 0

    # Luego, agrega el texto con el indicador al gráfico
    fig.add_annotation(text=f"Impacto de reorden: {indicador_cambio:.2f}%",
                       xref="paper", yref="paper", x=0.5, y=-0.1,  # Posición del texto (ajusta y según sea necesario)
                       showarrow=False,
                       font=dict(family="Arial", size=12, color="black"),
                       xanchor='center',
                       yanchor='middle')
    #---------------
    fig.update_xaxes(title="", showticklabels=False)
    fig.update_traces(hoverinfo='skip', hovertemplate=None)

    fig.show()

In [None]:
"""
a = seleccionar_especialidad()
  tripleMEDIDA(a)
"""

'\na = seleccionar_especialidad()\ngrafico_odms(a)\n'

In [69]:
for especialidad in especialidades: # O top12
    tripleMEDIDA(especialidad)


## EL INDICADOR DE CAMBIO
El indicador mide el **cambio en la clasificación de los postulantes** al pasar del **ODM_CRUDO** al **ODM** de 2025 (con los 5 puntos extra para universidades nacionales). El valor de 0 indicaría que no cambió el orden, y un valor de 100 indicaría que el orden se modificó tanto que todos los postulantes de universidades argentinas quedan por arriba de los extranjeros en cuanto a su orden de mérito (columna de **EXTREMO**).

---
Este indicador se basa en la **distancia de la reordenación**: Si cada postulante es un objeto en una fila. El indicador mide el desplazamiento total de todos los objetos entre las dos primeras columnas (**ODM_CRUDO** y **ODM**) y lo compara con el desplazamiento máximo posible, que es la distancia total entre la primera columna y la columna **EXTREMO**.

1.  **Cálculo del cambio real (Distancia A)**: Se suma la diferencia absoluta en el número de posición de cada postulante al pasar de la clasificación `ODM_CRUDO` a la clasificación `ODM`.
    * Ejemplo: Un postulante pasa del puesto 10 al 8. La diferencia absoluta es `|10 - 8| = 2`.
    * Se repite este cálculo para todos los postulantes y se suman todas las diferencias. Esta es la magnitud del cambio que realmente ocurrió.

2.  **Cálculo del cambio máximo (Distancia B)**: Se suma la diferencia absoluta en el número de posición de cada postulante al pasar de la clasificación `ODM_CRUDO` a la clasificación `EXTREMO`.
    * Esto representa el máximo cambio posible que podría haber ocurrido si la nueva reglamentación hubiera clasificado a los postulantes exactamente en el orden "ideal" del escenario `EXTREMO`.

3.  **Cálculo del indicador**: Finalmente, se divide el cambio real (Distancia A) por el cambio máximo (Distancia B) y se multiplica por 100 para obtener un porcentaje.

$$\text{Indicador de cambio} = \left(\frac{\text{Distancia A}}{\text{Distancia B}}\right) \times 100$$

---

### Interpretación de los valores

El valor del indicador siempre estará entre 0 y 100, y cada extremo tiene un significado claro y preciso para las autoridades.

* **0**: Significa que la nueva reglamentación (`ODM`) no tuvo **ningún impacto** en el orden de mérito de los postulantes. La clasificación por `ODM` es idéntica a la clasificación por `ODM_CRUDO`, lo que indica que la nueva reglamentación no produjo el efecto.

* **100**: Significa que la nueva reglamentación (`ODM`) logró su **máximo impacto posible**. La clasificación de los postulantes es exactamente la misma que la clasificación del escenario `EXTREMO`. Esto indica que la reglamentación fue reordenó completamente a los postulantes.

* **Valores intermedios (ej. 45)**: Un valor como el 45 significa que el reordenamiento de los postulantes se acercó casi a la mitad del extremo.

En resumen, el indicador es una herramienta numérica que permite evaluar el **grado de impacto** de la nueva reglamentación al comparar el cambio observado con el cambio extremo que podía llegar a causar una medida como la que se utilizó.

In [None]:
! pip install Pillow
! pip install "plotly>=5.1.0"



In [None]:
from PIL import Image
import io

fig = go.Figure()


# Tu código para generar el gráfico
...

# Convertir la figura a una imagen PNG en memoria
fig_bytes = fig.to_image(format="png")

# Abrir la imagen con Pillow y guardarla
image = Image.open(io.BytesIO(fig_bytes))
image.save("nombre_del_grafico.png")

# Oferta de cargos

De
[esta pagina del gobierno](https://www.argentina.gob.ar/salud/residencias/ingreso/oferta-de-cargos)
saco el [json](https://sheets.googleapis.com/v4/spreadsheets/1MuhaLJOG9fmimJtPcYMO5rHJQp2cltJnCMDKl8jxvBk/values/3.%20oferta_cargos?key=AIzaSyCq2wEEKL9-6RmX-TkW23qJsrmnFHFf5tY&alt=json) que tras filtrar, agrupar y sumar, obtendré la cantidad de cargos ofrecidos por especialidad


In [None]:
# uniformar las especialidades para que esten en mayusculas y sin tildes como en el json
import unicodedata

def quitar_tildes(texto):
    return ''.join(
        c for c in unicodedata.normalize('NFD', texto)
        if unicodedata.category(c) != 'Mn')
# Crear nueva lista sin tildes
especialidadesUp = [quitar_tildes(e).upper() for e in especialidades]
print(especialidadesUp)


In [None]:
import pandas as pd
import json

def procesar_oferta_cargos(nombre_archivo, especialidades):
    with open(nombre_archivo, "r", encoding="utf-8") as f:
        data = json.load(f)
    rows = data["values"]
    headers = rows[0]
    records = rows[2:]
    fixed_records = [r + [""] * (len(headers) - len(r)) for r in records]
    df = pd.DataFrame(fixed_records, columns=headers)
    numeric_cols = ["basica", "posbasica", "concurrencia"]
    df[numeric_cols] = df[numeric_cols].apply(pd.to_numeric, errors="coerce").fillna(0).astype(int)
    df = df[["filtro-concurso", "filtro-especialidad", "basica"]]
    nombreCols = ["concurso", "especialidad", "oferta"]
    df.columns = nombreCols
    df_examenU = df[df['concurso'] == 'CONCURSO UNIFICADO']
    df_examenU = df_examenU[df_examenU["especialidad"].str.upper().isin(especialidades)]
    cargos_por_especialidad = df_examenU.groupby("especialidad")['oferta'].sum().reset_index()
    cargos_por_especialidad = cargos_por_especialidad[cargos_por_especialidad["oferta"] > 0]
    cargos_por_especialidad = cargos_por_especialidad.sort_values(by="especialidad")
    return cargos_por_especialidad


In [None]:
txt_url = "https://raw.githubusercontent.com/LuisaBeccar/ODMexamen/main/generar_data/oferta_cargos.txt"
# Aquí asumes que procesar_oferta_cargos espera un string que es la ruta o URL del archivo
oferta_cargosU = procesar_oferta_cargos(txt_url, especialidadesUp)
print(oferta_cargosU)


## hacerle la linea de oferta


In [None]:
def grafico_odms2(especialidad):
    df_esp = df[df['ESPECIALIDAD'] == especialidad].copy()

    # Ordenar por ODM y asignar orden de mérito para cada variable
    df_odm = df_esp.sort_values('ODM').reset_index(drop=True)
    df_odm['Orden'] = np.arange(1, len(df_odm)+1)
    df_odm['Variable'] = 'ODM'

    df_crudo = df_esp.sort_values('ODM_CRUDO').reset_index(drop=True)
    df_crudo['Orden'] = np.arange(1, len(df_crudo)+1)
    df_crudo['Variable'] = 'ODM_CRUDO'

    df_long = pd.concat([df_odm, df_crudo], ignore_index=True)

    # Para gráfico de barras horizontales con facet col para las dos variables
    fig = px.bar(df_long,
                 x=[1]*len(df_long),  # Barras del mismo ancho
                 y='Orden',
                 color='TIPO_UNI',
                 orientation='h',
                 facet_col='Variable',
                 color_discrete_map={'N': 'lightskyblue', 'E': 'red'},
                 category_orders={'':['ODM', 'ODM_CRUDO']},
                 labels={'Orden': 'Orden de mérito', 'TIPO_UNI': 'Tipo de universidad'},
                 height=400,
                 width=400)

    # Sacar la oferta para la especialidad
    oferta = oferta_cargosU.loc[oferta_cargosU['especialidad'] == especialidad, 'oferta'].values
    if len(oferta) > 0:
        oferta_val = oferta[0]
        for idx, var in enumerate(['ODM', 'ODM_CRUDO'], start=1):
            fig.add_shape(type="line",
                           x0=0,
                           x1=1,
                           xref="paper",   # barra a lo ancho de la faceta
                           y0=oferta_val,
                           y1=oferta_val,
                           yref=f'y{idx}',  # Asegúrate de que esto sea correcto
                           line=dict(color="black", width=4, dash="dashdot"),
                          )

    # Actualizar trazas y ejes
    fig.update_traces(marker_line_width=0, textfont_size=8)
    fig.update_yaxes(autorange='reversed')
    fig.update_layout(title={ 'text': f"{especialidad}: <span style='font-size:12px;'>{len(df_esp)} postulantes</span><br>",
                              'x': 0, 'xanchor': 'left', 'y': 0.95, 'yanchor': 'top', 'pad': {'b': 20, 't': 10}, })

    fig.update_xaxes(showticklabels=False, title=None)
    fig.for_each_annotation(lambda a: a.update(text=a.text.split('=')[-1]))
    fig.update_yaxes(range=[100, 500])
    fig.update_traces(hoverinfo='skip', hovertemplate=None)

    fig.show()

