# Esquemas de pagos a jurados 
**Consejo de la Magistratura** 10/2020

---
Se realizan simulaciones de cantidad de concursos y cantidad de exámenes por concurso para el próximo año. Con esto, se puede analizar el potencial costo requerido según distintos esquemas de pagos a los jurados. 

Estos esquemas estan conformados por ciertos parámetros:

Parámetros
---
- **piso**: Monto mínimo que van a percibir todos los jurados.
- **tope**: Monto máximo que van a percibir todos los jurados.
- **max_correccion**: Cantidad máxima de exámenes que van a corregir los jurados.
- **divide_en**: A partir de qué momento se empiezan a repartir los exámenes entre los jurados.
- **correctores_inicial**: Cuántos jurados comienzan.
- **agregan**: Cuántos jurados se agregan cada vez que se pasa la corrección máxima.

---
Explicación
---
- Comienza con una cantidad de jurados (**correctores_inicial**) y se reparten asegurando que todos los exámenes sean revisados por dos de ellos.
- Cuando llega a uno de los máximos de corrección (según el valor de **max_correccion**), se agrega la cantidad **agrega** de jurados.

---
Info y gráficos
---

### Parámetros interactivos
- Los parámetros son interactivos. Se pueden cambiar para analizar como se modifican los resultados de costos
- El parámetro **tipo** contiene dos valores: *violin* y *hist*. Éste es el tipos de grafico a mostrar.

### Tabla 
La tabla muestra los resultados (costos) de los concursos del año 2020 según los parametros elegidos. Abajo se menciona el costo total correspondiente a todo el año.

### Gráficos
Los gráficos se separan en 3 distribuciones: 
- FIJO20: misma cantidad de concursos que en 2020.
- MITAD_MAS: a la cantidad de concursos de 2020 se le agrega la mitad.
- DOBLE: con el doble de la cantidad de concursos que en 2020.

### Tipos
- violin: se muestra la distribución de los costos de las simulaciones para cada combinacion de parámetros elegido arriba. La línea negra representa el límite del presupuesto actual.
- hist: histograma que muestra la misma información. La línea roja representa el límite presupuestario actual.

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import ipywidgets as widgets
import plotly.express as px
import re
import warnings
warnings.filterwarnings('ignore')

In [2]:
params = pd.read_csv('https://raw.githubusercontent.com/lucaspecina/pagos-jurados/master/nuevos_esquemas_pagos_1.csv')
RESULTADOS = params.copy()

In [3]:
RESULTADOS

Unnamed: 0,piso,tope,max_correccion,divide_en_max,correctores_inicial,agregan,pend,limite,FIJO20_costo_bootstrap,FIJO20_media_costo,...,MITAD_MAS_diferencia_limite_boot,MITAD_MAS_media_boot,MITAD_MAS_std_boot,MITAD_MAS_porcentaje_inferior_0,DOBLE_costo_bootstrap,DOBLE_media_costo,DOBLE_diferencia_limite_boot,DOBLE_media_boot,DOBLE_std_boot,DOBLE_porcentaje_inferior_0
0,4000,35000,80,1,2,1,388.0,2520000.0,[2972764. 2740824. 3098688. 3134892. 3428016. ...,3.035520e+06,...,[-1935760. -1963668. -1909136. -2050700. -1134...,-2.142840e+06,420471.491126,1.0,[5976512. 6387708. 6163020. 6705036. 5277236. ...,6.096773e+06,[-3456512. -3867708. -3643020. -4185036. -2757...,-3.576773e+06,635463.116722,1.0
1,4000,35000,80,1,2,2,388.0,2520000.0,[3534480. 3099792. 2765800. 3135248. 2455808. ...,3.297478e+06,...,[-2357840. -3147712. -3174632. -2074048. -3558...,-2.632877e+06,499707.415133,1.0,[5740472. 6815744. 7125920. 6396632. 5665792. ...,6.524760e+06,[-3220472. -4295744. -4605920. -3876632. -3145...,-4.004760e+06,692417.330448,1.0
2,4000,35000,80,1,3,1,388.0,2520000.0,[3219668. 3609644. 2433000. 3532432. 4519760. ...,3.278783e+06,...,[-3009452. -2942356. -1850924. -2682600. -2517...,-2.360770e+06,479581.310165,1.0,[6114036. 7200608. 6831612. 6012768. 6580992. ...,6.572405e+06,[-3594036. -4680608. -4311612. -3492768. -4060...,-4.052405e+06,478772.473111,1.0
3,4000,35000,80,1,3,2,388.0,2520000.0,[3661852. 3266168. 4273928. 3969664. 3855204. ...,3.711097e+06,...,[-2584180. -1920980. -3524188. -2620060. -2499...,-2.613870e+06,586004.725918,1.0,[7651932. 7126084. 6858772. 6847816. 7932012. ...,7.165291e+06,[-5131932. -4606084. -4338772. -4327816. -5412...,-4.645291e+06,400766.796724,1.0
4,4000,35000,80,1,4,1,388.0,2520000.0,[3141872. 3070240. 2413016. 4535204. 2856000. ...,3.418940e+06,...,[-1049620. -1814680. -3220336. -2772252. -1828...,-2.302243e+06,756456.351084,1.0,[6719744. 6369076. 6761796. 6788300. 6151464. ...,6.601706e+06,[-4199744. -3849076. -4241796. -4268300. -3631...,-4.081706e+06,433391.159556,1.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
427,8000,50000,120,2,2,2,350.0,2520000.0,[3909400. 3805100. 3169300. 3450400. 3816700. ...,3.283540e+06,...,[-2913700. -2450700. -2646600. -2603400. -2705...,-2.470707e+06,428206.524108,1.0,[6200800. 8456200. 6696000. 6166600. 7054100. ...,6.934607e+06,[-3680800. -5936200. -4176000. -3646600. -4534...,-4.414607e+06,796563.093518,1.0
428,8000,50000,120,2,3,1,350.0,2520000.0,[3901600. 4108400. 3859250. 3802450. 3483800. ...,3.868870e+06,...,[-2944350. -3825900. -2798900. -2287300. -3936...,-3.179273e+06,415243.878489,1.0,[7550650. 7606000. 8191350. 8015700. 7624800. ...,7.633203e+06,[-5030650. -5086000. -5671350. -5495700. -5104...,-5.113203e+06,248588.562667,1.0
429,8000,50000,120,2,3,2,350.0,2520000.0,[4091400. 3454600. 4003550. 3779450. 3133800. ...,3.914463e+06,...,[-3529400. -3588350. -4562750. -3066900. -3996...,-3.562190e+06,443563.786544,1.0,[9029150. 8380200. 8410650. 8122350. 6831900. ...,7.949010e+06,[-6509150. -5860200. -5890650. -5602350. -4311...,-5.429010e+06,665864.591139,1.0
430,8000,50000,120,2,4,1,350.0,2520000.0,[3949950. 3739200. 3717950. 3797200. 3812600. ...,3.854217e+06,...,[-3541900. -3038450. -3006750. -3174750. -2745...,-3.184457e+06,371483.966844,1.0,[8766800. 7370600. 8600550. 8349200. 7171100. ...,8.063577e+06,[-6246800. -4850600. -6080550. -5829200. -4651...,-5.543577e+06,494578.940402,1.0


In [3]:
RESULTADOS['FIJO20_costo_bootstrap'] = RESULTADOS.apply(lambda x:
        [int(valor) for valor in re.findall('[-]?\d+', x.FIJO20_costo_bootstrap)],axis='columns')

RESULTADOS['MITAD_MAS_costo_bootstrap'] = RESULTADOS.apply(lambda x:
        [int(valor) for valor in re.findall('[-]?\d+', x.MITAD_MAS_costo_bootstrap)],axis='columns')

RESULTADOS['DOBLE_costo_bootstrap'] = RESULTADOS.apply(lambda x:
        [int(valor) for valor in re.findall('[-]?\d+', x.DOBLE_costo_bootstrap)],axis='columns')

In [4]:
def tabla_ganancia_individual(piso,pend,tope,max_correccion):
    '''Se le pasa los parametros y 
    calcula segun la cantidad corregida cuanto ganaria.
    Devuelve el dataframe con los valores para cada cantidad de correcciones'''
    
    max_correccion = max_correccion*10
    df = pd.DataFrame({'cantidad_examenes':np.arange(0,max_correccion+1,1)})
    df['funcion'] = 0*len(df)
    
    for ex in range(int(max_correccion+1)):
        if ex == 0:
            df.loc[ex,'funcion'] = piso
        
        elif df.loc[ex-1,'funcion'] >= tope:
             df.loc[ex:,'funcion'] = tope 
             break
        else:
            df.loc[ex,'funcion'] = df.loc[ex-1,'funcion'] + pend
        if df.loc[ex,'funcion'] >=tope:
            df.loc[ex,'funcion'] = tope
    return(df)


################################################################################


def costo_indiv_concurso(df, cantidad_ex):
    '''Para cada corrector devuelve lo que hay que pagarle por concurso
       segun la cantidad de examenes que corrige'''
    costo_indiv = df.loc[df.cantidad_examenes==int(cantidad_ex),'funcion'].values[0]
#     print('costo_corrector: ',costo_indiv)
    return costo_indiv


################################################################################

def tabla_costo_anual(correctores_inicial,piso,pend,tope,max_correccion,año,agregan,divide_en_max):
    '''DEVUELVE:
        [0] : dataframe de costos para toda la distribucion (original o bootstrapp). Es todo un año.
        [1] : suma de costos total para toda la dist (por ej todo el año)
        [2] : df de los pagos individuales segun los parametros (lo que sale de calcular_lineal_max)'''
    
    # TABLA DE COSTOS INDIVIDUALES PARA ESTOS PARAMETROS
    tabla_ganancia = tabla_ganancia_individual(piso,pend,tope,max_correccion)
    
    data_concursos = {}

    '''ERROR -> ESTABA SOBREESCRIBIENDO PORQUE ESTOY USANDO UN VALOR COMO INDICE'''
    for ID,conc in enumerate(año): # PARA CADA CONCURSO

        # CALCULO LA CANTIDAD DE CORRECTORES PARA CADA CONCURSO Y LA CANT DE EXAMENES Q TIENEN Q CORREGIR
        data_concursos[ID] = []
        data_concursos[ID].append(conc)

        '''la division es de a pares, no es completa'''
        if conc <= max_correccion:
            correctores = correctores_inicial
            cant_cada_uno = conc//(correctores//2)
            cant_cada_uno = max_correccion if cant_cada_uno > max_correccion else cant_cada_uno
        #hasta 2max hacemos que cada examen sea corregido por minimo dos. Si son 3 iniciales pagamos mas. 
        #a menos que divide_en_max == 1
        elif (conc <= 2*max_correccion):
            correctores = correctores_inicial
            '''divide_en_max==1 significa que empezamos a dividir cuando pasamos el primer maximo, no el segundo'''
            cant_cada_uno = conc//correctores if (divide_en_max==1) else conc//(correctores//2)
            cant_cada_uno = max_correccion if cant_cada_uno > max_correccion else cant_cada_uno
            
        #despues, se divide todo por la cantidad de correctores
        else:
            # esto va asi porq empezamos a sumar correctores cuando pasa EL SEGUNDO MAXIMO
            cant = conc - max_correccion
            correctores = correctores_inicial
            while cant > max_correccion:
                cant = cant - max_correccion
                correctores += agregan
            cant_cada_uno = conc//correctores        
            cant_cada_uno = max_correccion if cant_cada_uno > max_correccion else cant_cada_uno

        #CALCULO COSTO INDIVIDUAL DE CORRECTOR EN UN CONCURSO (SEGUN EXAMENES)
        costo_corrector = costo_indiv_concurso(tabla_ganancia,cant_cada_uno)
        
        #MULTIPLICO Y CALCULO EL COSTO DEL CONCURSO
        costo_concurso = correctores * costo_corrector

        # ARMO LO NECESARIO
        data_concursos[ID].append(correctores)
        data_concursos[ID].append(cant_cada_uno)
        data_concursos[ID].append(costo_corrector)
        data_concursos[ID].append(costo_concurso)        

        # INCLUYO EN EL DF
        data_concursos_df = pd.DataFrame.from_dict(data_concursos,orient='index').reset_index()
        data_concursos_df.columns= ['ID','EXAMENES_por_concurso','correctores','exam_cada_uno','ganancia_cada_corrector','costo_total']

        
    return (data_concursos_df,data_concursos_df.costo_total.sum(),tabla_ganancia)


In [31]:
def plotear(tipo='violin',piso=6000,tope=40000,max_correccion=100,divide_en_max=1,correctores_inicial=2,agregan=1):
    data_plot = RESULTADOS[(RESULTADOS.piso==piso) & 
                       (RESULTADOS.tope==tope) & 
                       (RESULTADOS.max_correccion==max_correccion) & 
                       (RESULTADOS.divide_en_max==divide_en_max) &
                       (RESULTADOS.correctores_inicial==correctores_inicial) &
                       (RESULTADOS.agregan==agregan)]
    
    print(f'PENDIENTE: ${data_plot.pend.values[0]} por exámen')
    print(f'LÍMITE PRESUPUESTARIO: ${limite}')
    
    # EJEMPLO
    from IPython.display import display
    print('\n\n\nTABLA CON LA INFORMACIÓN Y COSTOS DEL AÑO 2020 PARA EL ESQUEMA ELEGIDO')
    pend= round((tope-piso)/(max_correccion),0)
    tabla_mostrar = tabla_costo_anual(correctores_inicial,piso,pend,tope,
                      max_correccion,dist_año,agregan,divide_en_max)[0].drop(columns='ID')
    display(tabla_mostrar.sort_values('EXAMENES_por_concurso',ascending=True))
    print('Costo para el año 2020 con estos parametros: $',tabla_mostrar.costo_total.sum())
    print(f'Presupuesto: ${limite} - Costo nuevo: ${tabla_mostrar.costo_total.sum()} \nRESULTADO= ${limite-tabla_mostrar.costo_total.sum()} \nRESULTADO(%)= %{round((limite-tabla_mostrar.costo_total.sum())/limite*100,2)}')

    print(f'\nCOSTO MEDIO DE SIMULACIONES CON MISMA CANTIDAD DE CONCURSOS QUE 2020 (22 concursos): ${np.array(data_plot.FIJO20_costo_bootstrap.values[0]).mean()}')
    print(f'Presupuesto: ${limite} - Costo nuevo: ${np.array(data_plot.FIJO20_costo_bootstrap.values[0]).mean()} \nRESULTADO= ${limite-np.array(data_plot.FIJO20_costo_bootstrap.values[0]).mean()} \nRESULTADO(%)= %{round((limite-np.array(data_plot.FIJO20_costo_bootstrap.values[0]).mean())/limite*100,2)}')
    print(f'\nCOSTO MEDIO DE SIMULACIONES CON 1.5 LA CANTIDAD DE CONCURSOS QUE 2020 (33 concursos): ${np.array(data_plot.MITAD_MAS_costo_bootstrap.values[0]).mean()}')
    print(f'Presupuesto: ${limite} - Costo nuevo: ${np.array(data_plot.MITAD_MAS_costo_bootstrap.values[0]).mean()} \nRESULTADO= ${limite-np.array(data_plot.MITAD_MAS_costo_bootstrap.values[0]).mean()} \nRESULTADO(%)= %{round((limite-np.array(data_plot.MITAD_MAS_costo_bootstrap.values[0]).mean())/limite*100,2)}')
    print(f'\nCOSTO MEDIO DE SIMULACIONES CON EL DOBLE DE CANTIDAD DE CONCURSOS QUE 2020(44 concursos): ${np.array(data_plot.DOBLE_costo_bootstrap.values[0]).mean()}')
    print(f'Presupuesto: ${limite} - Costo nuevo: ${np.array(data_plot.DOBLE_costo_bootstrap.values[0]).mean()} \nRESULTADO= ${limite-np.array(data_plot.DOBLE_costo_bootstrap.values[0]).mean()} \nRESULTADO(%)= %{round((limite-np.array(data_plot.DOBLE_costo_bootstrap.values[0]).mean())/limite*100,2)}')
    
    # PLOT VIOLIN
    if tipo=='violin':
        df_plot = pd.DataFrame({'FIJO20':data_plot['FIJO20_costo_bootstrap'].values[0],
                                'MITAD_MAS':data_plot['MITAD_MAS_costo_bootstrap'].values[0],
                                'DOBLE':data_plot['DOBLE_costo_bootstrap'].values[0]})
        df_plot = df_plot.melt()
        df_plot.columns = ['cantidad_concursos','costo']
        fig = px.violin(df_plot, y="costo", x="cantidad_concursos", box=True, color='cantidad_concursos')
        fig.update_layout(shapes=[
            dict(
              type= 'line',
              xref= 'paper', x0= 0, x1= 1,
              yref= 'y', y0= limite, y1= limite )])
        fig.show()
    
    # PLOT HISTOGRAM
    else:
        fig,axes = plt.subplots(3,1,figsize=(14,11),sharex=True)
        
        sns.distplot(data_plot.FIJO20_costo_bootstrap.values[0],ax=axes[0])
        axes[0].axvline(x=limite,color='red',linestyle='--')
        axes[0].set_title(f'Simulaciones con misma cantidad de concursos que 2020 (22). PROMEDIO de COSTO: ${round(data_plot.FIJO20_media_costo.values[0],1)}')

        sns.distplot(data_plot.MITAD_MAS_costo_bootstrap.values[0],ax=axes[1])
        axes[1].axvline(x=limite,color='red',linestyle='--')
        axes[1].set_title(f'Simulaciones con %50 más de concursos que 2020 (33). PROMEDIO de COSTO: ${round(data_plot.MITAD_MAS_media_costo.values[0],1)}')

        sns.distplot(data_plot.DOBLE_costo_bootstrap.values[0],ax=axes[2])
        plt.axvline(x=limite,color='red',linestyle='--')
        axes[2].set_title(f'Simulaciones con el doble de concursos que 2020 (44). PROMEDIO de COSTO: ${round(data_plot.DOBLE_media_costo.values[0],1)}')
        plt.text(x=limite,y=0,s=f'límite presupuesto: ${limite}',color='red',fontsize=14)
        plt.xlabel('COSTO')
        
    
    
    
def plotear_resultado(RESULTADOS, *vec_params):
    slider = widgets.interact(plotear,
                    tipo = ['violin','hist'],
                    piso = piso_vec,
                    tope = tope_vec,
                    max_correccion = max_correccion_vec,
                    divide_en_max = divide_en_max_vec,
                    correctores_inicial=correctores_inicial_vec,
                    agregan = agregan_vec)

    display(slider)

In [32]:
'''LIMITE PRESUPUESTARIO'''
# limite = (3_000_000 - (3_000_000*0.16))
limite = 3_950_000

'''DISTRIBUCION PRUEBA'''
# año 2020
dist_año = pd.Series([17,170,227,773,585,431,710,741,337,266,240,597,236,87,257,196,
                      212,167,78,391,143,45])

piso_vec = [4000,6000,8000]
tope_vec = [35000,40000,45000,50000]
max_correccion_vec = [80,100,120]
divide_en_max_vec = [1,2]
correctores_inicial_vec = [2,3,4]
agregan_vec = [1,2]
vec_params = [piso_vec,tope_vec,max_correccion_vec,divide_en_max_vec,correctores_inicial_vec,agregan_vec]

In [33]:
plotear_resultado(RESULTADOS,vec_params)

interactive(children=(Dropdown(description='tipo', options=('violin', 'hist'), value='violin'), Dropdown(descr…

<function __main__.plotear(tipo='violin', piso=6000, tope=40000, max_correccion=100, divide_en_max=1, correctores_inicial=2, agregan=1)>