In [43]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import ipywidgets as widgets
from sklearn.utils import resample

In [44]:
def tabla_ganancia_individual(piso,pend,tope,max_correccion):
    '''Se le pasa los parametros y 
    calcula segun la cantidad corregida cuanto ganaria.
    Devuelve el dataframe con los valores para cada cantidad de correcciones'''
    
    max_correccion = max_correccion*10
    df = pd.DataFrame({'cantidad_examenes':np.arange(0,max_correccion+1,1)})
    df['funcion'] = 0*len(df)
    
    for ex in range(int(max_correccion+1)):
        if ex == 0:
            df.loc[ex,'funcion'] = piso
        
        elif df.loc[ex-1,'funcion'] >= tope:
             df.loc[ex:,'funcion'] = tope 
             break
        else:
            df.loc[ex,'funcion'] = df.loc[ex-1,'funcion'] + pend
        if df.loc[ex,'funcion'] >=tope:
            df.loc[ex,'funcion'] = tope
    return(df)


################################################################################


def costo_indiv_concurso(df, cantidad_ex):
    '''Para cada corrector devuelve lo que hay que pagarle por concurso
       segun la cantidad de examenes que corrige'''
    costo_indiv = df.loc[df.cantidad_examenes==int(cantidad_ex),'funcion'].values[0]
#     print('costo_corrector: ',costo_indiv)
    return costo_indiv


################################################################################

def tabla_costo_anual(correctores_inicial,piso,pend,tope,max_correccion,año,agregan,divide_en_max,porcen_corregir):
    '''DEVUELVE:
        [0] : dataframe de costos para toda la distribucion (original o bootstrapp). Es todo un año.
        [1] : suma de costos total para toda la dist (por ej todo el año)
        [2] : df de los pagos individuales segun los parametros (lo que sale de calcular_lineal_max)'''
    
    # TABLA DE COSTOS INDIVIDUALES PARA ESTOS PARAMETROS
    tabla_ganancia = tabla_ganancia_individual(piso,pend,tope,max_correccion)
    
    # TRANSFORMO CANTIDAD DE EXAMENES POR CONCURSO SEGUN PORCEN_CORREGIR
    año_tranformado = np.array(año)*porcen_corregir
    
    data_concursos = {}

    '''ERROR -> ESTABA SOBREESCRIBIENDO PORQUE ESTOY USANDO UN VALOR COMO INDICE'''
    for ID,conc in enumerate(año_tranformado): # PARA CADA CONCURSO

        # CALCULO LA CANTIDAD DE CORRECTORES PARA CADA CONCURSO Y LA CANT DE EXAMENES Q TIENEN Q CORREGIR
        data_concursos[ID] = []
        data_concursos[ID].append(conc)

        '''la division es de a pares, no es completa'''
        if conc <= max_correccion:
            correctores = correctores_inicial
            cant_cada_uno = conc//(correctores//2)
            cant_cada_uno = max_correccion if cant_cada_uno > max_correccion else cant_cada_uno
        #hasta 2max hacemos que cada examen sea corregido por minimo dos. Si son 3 iniciales pagamos mas. 
        #a menos que divide_en_max == 1
        elif (conc <= 2*max_correccion):
            correctores = correctores_inicial
            '''divide_en_max==1 significa que empezamos a dividir cuando pasamos el primer maximo, no el segundo'''
            cant_cada_uno = conc//correctores if (divide_en_max==1) else conc//(correctores//2)
            cant_cada_uno = max_correccion if cant_cada_uno > max_correccion else cant_cada_uno
            
        #despues, se divide todo por la cantidad de correctores
        else:
            # esto va asi porq empezamos a sumar correctores cuando pasa EL SEGUNDO MAXIMO
            cant = conc - max_correccion
            correctores = correctores_inicial
            while cant > max_correccion:
                cant = cant - max_correccion
                correctores += agregan
            cant_cada_uno = conc//correctores        
            cant_cada_uno = max_correccion if cant_cada_uno > max_correccion else cant_cada_uno

        #CALCULO COSTO INDIVIDUAL DE CORRECTOR EN UN CONCURSO (SEGUN EXAMENES)
        costo_corrector = costo_indiv_concurso(tabla_ganancia,cant_cada_uno)
        
        #MULTIPLICO Y CALCULO EL COSTO DEL CONCURSO
        costo_concurso = correctores * costo_corrector

        # ARMO LO NECESARIO
        data_concursos[ID].append(correctores)
        data_concursos[ID].append(cant_cada_uno)
        data_concursos[ID].append(costo_corrector)
        data_concursos[ID].append(costo_concurso)        

        # INCLUYO EN EL DF
        data_concursos_df = pd.DataFrame.from_dict(data_concursos,orient='index').reset_index()
        data_concursos_df.columns= ['ID','EXAMENES_por_concurso','correctores','exam_cada_uno','ganancia_cada_corrector','costo_total']

        
    return (data_concursos_df,data_concursos_df.costo_total.sum(),tabla_ganancia)


In [45]:
def simulaciones_año(simulaciones,correctores_inicial,piso,pend,tope,max_correccion,año,agregan,divide_en_max,variacion,porcen_corregir,indice):
    '''para una combinacion de parametros y cantidad de concursos para el año, 
       simula UN AÑO, varias veces'''
    
    if indice%50==0:
        print('\nCOMBINACION DE PARAMETROS NUMERO: '+str(indice)) 
    
    costos = []

    # CANTIDAD DE AÑOS SIMULADOS PARA ESTA COMBINACION DE PARAMETROS
    for i in range(simulaciones):
        #print(f'Simulacion nro: {i}')

        # CANTIDAD DE CONCURSOS        
        cant_concursos = int( variacion * len(año) )
                
        #SIMULO UN AÑO
        año_simulado = resample(año, replace=True, n_samples= cant_concursos)

        #CALCULO EL COSTO DEL AÑO SIMULADO (SOLO EL RESULTADO)
        costo_año = tabla_costo_anual(correctores_inicial,piso,pend,tope,max_correccion,año_simulado,agregan,divide_en_max,porcen_corregir)[1]

        #LO AGREGO A LISTA
        costos.append(costo_año)

    return np.array(costos)

################################################################################

def armado_original(params, año20):
    '''PARA EL AÑO 2020 CON EL NUEVO ESQUEMA'''

    df_original = params.copy()

    #CALCULO EL COSTO TOTAL DEL AÑO
    df_original['costo_nuevo'] = df_original.apply(lambda x:
             tabla_costo_anual(x.correctores_inicial,x.piso,x.pend,x.tope,
             x.max_correccion,dist20,x.agregan,x.divide_en_max)[1],axis='columns') # el [1] devuelve solo el costo total


    #CALCULO LA DIFERENCIA CON EL LIMITE (SI DA NEGATIVO ES QUE NOS PASAMOS)
    df_original['diferencia_limite'] = df_original.limite - df_original.costo_nuevo

    #CALCULO CUAL ES EL PORCENTAJE POR EL QUE NOS PASAMOS (SI DA NEGATIVO ES QUE NOS PASAMOS)
    df_original['cambio_porcen_limite'] =  df_original.diferencia_limite / df_original.limite

    #COSTO VIEJO
    df_original['costo_viejo'] = 2*31200*len(año20)

    #DIFERENCIA CON EL METODO VIEJO (SI DA NEGATIVO ES QUE NOS PASAMOS)
    df_original['diferencia_metodo'] = df_original.costo_viejo - df_original.costo_nuevo

    return df_original

################################################################################

def armado_simulacion(params, año, simulaciones):
    
    # BOOTSTRAP
    
    metodo_cant_concursos = {'FIJO20':1, 'MITAD_MAS':1.5,'DOBLE':2}
    
    for cant_concursos,multiplicar_por in metodo_cant_concursos.items():
        
        print('\nCANTIDAD DE CONCURSOS (ESCALADO): '+cant_concursos)
        
        '''LISTA DE COSTOS DE LOS AÑOS SIMULADOS'''
        params[f'{cant_concursos}_costo_bootstrap'] = params.apply(lambda x:
                simulaciones_año(simulaciones, x.correctores_inicial,x.piso,x.pend,x.tope,
                                     x.max_correccion,año,x.agregan,x.divide_en_max,
                                     multiplicar_por, x.porcen_corregir, x.name),axis=1)
        
        '''COSTO MEDIO DE LOS AÑOS SIMULADOS'''
        params[f'{cant_concursos}_media_costo'] = params.apply(lambda x: x[f'{cant_concursos}_costo_bootstrap'].mean(), axis='columns')
        
        '''LISTA DE DIFERENCIAS DE LOS COSTOS CON EL LIMITE (SI DA NEGATIVO ES QUE NOS PASAMOS)'''
        params[f'{cant_concursos}_diferencia_limite_boot'] = params.apply(lambda x: np.array([x.limite - costo for costo in x[f'{cant_concursos}_costo_bootstrap']]), axis='columns')
        
        '''DIFERENCIA MEDIA Y STD DE LOS COSTOS CON EL LIMITE (SI DA NEGATIVO ES QUE NOS PASAMOS)'''
        params[f'{cant_concursos}_media_boot'] = params.apply(lambda x: x[f'{cant_concursos}_diferencia_limite_boot'].mean(), axis='columns')
        params[f'{cant_concursos}_std_boot'] = params.apply(lambda x: x[f'{cant_concursos}_diferencia_limite_boot'].std(), axis='columns')
        
        '''PORCENTAJE DE AÑOS SIMULADOS QUE NOS PASAMOS DEL LIMITE'''
        params[f'{cant_concursos}_porcentaje_inferior_0'] = params.apply(lambda x: len(x[f'{cant_concursos}_diferencia_limite_boot'][x[f'{cant_concursos}_diferencia_limite_boot']<0])/
                                                                 len(x[f'{cant_concursos}_diferencia_limite_boot']),axis='columns')
    
    return(params)


################################################################################

def plotear(tipo='violin',piso=6000,tope=40000,max_correccion=100,divide_en_max=1,correctores_inicial=2,agregan=1,porcen_corregir=1.0):
    data_plot = RESULTADOS[(RESULTADOS.piso==piso) & 
                       (RESULTADOS.tope==tope) & 
                       (RESULTADOS.max_correccion==max_correccion) & 
                       (RESULTADOS.divide_en_max==divide_en_max) &
                       (RESULTADOS.correctores_inicial==correctores_inicial) &
                       (RESULTADOS.agregan==agregan) & 
                       (RESULTADOS.porcen_corregir==porcen_corregir)]
    
    print(f'PENDIENTE: ${data_plot.pend.values[0]} por exámen')
    print(f'LÍMITE PRESUPUESTARIO: ${limite}')
    


    # PLOT VIOLIN
    if tipo=='violin':
        df_plot = pd.DataFrame({'FIJO20':data_plot['FIJO20_costo_bootstrap'].values[0],
                                'MITAD_MAS':data_plot['MITAD_MAS_costo_bootstrap'].values[0],
                                'DOBLE':data_plot['DOBLE_costo_bootstrap'].values[0]})
        df_plot = df_plot.melt()
        df_plot.columns = ['cantidad_concursos','costo']
        fig = px.violin(df_plot, y="costo", x="cantidad_concursos", box=True, color='cantidad_concursos')
        fig.update_layout(shapes=[
            dict(
              type= 'line',
              xref= 'paper', x0= 0, x1= 1,
              yref= 'y', y0= limite, y1= limite )])
        fig.show()
    
    # PLOT HISTOGRAM
    else:
        fig,axes = plt.subplots(3,1,figsize=(14,11),sharex=True)
        
        sns.distplot(data_plot.FIJO20_costo_bootstrap.values[0],ax=axes[0])
        axes[0].axvline(x=limite,color='red',linestyle='--')
        axes[0].set_title(f'Simulaciones con misma cantidad de concursos que 2020 (22). PROMEDIO de COSTO: ${round(data_plot.FIJO20_media_costo.values[0],1)}')

        sns.distplot(data_plot.MITAD_MAS_costo_bootstrap.values[0],ax=axes[1])
        axes[1].axvline(x=limite,color='red',linestyle='--')
        axes[1].set_title(f'Simulaciones con %50 más de concursos que 2020 (33). PROMEDIO de COSTO: ${round(data_plot.MITAD_MAS_media_costo.values[0],1)}')

        sns.distplot(data_plot.DOBLE_costo_bootstrap.values[0],ax=axes[2])
        plt.axvline(x=limite,color='red',linestyle='--')
        axes[2].set_title(f'Simulaciones con el doble de concursos que 2020 (44). PROMEDIO de COSTO: ${round(data_plot.DOBLE_media_costo.values[0],1)}')
        plt.text(x=limite,y=0,s=f'límite presupuesto: ${limite}',color='red',fontsize=14)
        plt.xlabel('COSTO')
        
        
    # EJEMPLO
    from IPython.display import display
    pend= round((tope-piso)/(max_exam),0)
    tabla_mostrar = tabla_costo_anual(correctores_inicial,piso,pend,tope,
                      max_correccion,dist_año,agregan,divide_en_max)[0].drop(columns='ID')
    display(tabla_mostrar.sort_values('EXAMENES_por_concurso',ascending=True))
    print('Costo para el año 2020 con estos parametros: $',tabla_mostrar.costo_total.sum())
    
    
def plotear_resultado(RESULTADOS, *vec_params):
    slider = widgets.interact(plotear,
                    tipo = ['violin','hist'],
                    piso = piso_vec,
                    tope = tope_vec,
                    max_correccion = max_correccion_vec,
                    divide_en_max = divide_en_max_vec,
                    correctores_inicial=correctores_inicial_vec,
                    agregan = agregan_vec,
                    porcen_corregir = porcen_corregir_vec)

    display(slider)

In [46]:
'''Repaso
Comienza con correctores_inicial y se reparten asegurando que todos los examenes los corrijan por lo menos dos. 
Y cuando llega a (1 si divide_en_max==1 else 2) * max_correccion, se agrega la cantidad agrega.'''

'''LIMITE PRESUPUESTARIO'''
# limite = (3_000_000 - (3_000_000*0.16))
limite = 3_950_000

'''DISTRIBUCION PRUEBA'''

# primera
# dist_año = pd.Series([17,170,227,773,585,431,710,741,337,266,240,597,236,87,
#                      257,196,212,167,78,391,143,45,1500,1000,615])

# año 2020
#dist_año = pd.Series([17,170,227,773,585,431,710,741,337,266,240,597,236,87,257,196,
#                      212,167,78,391,143,45])

# año 2021
dist_año = pd.Series([322,850,667,491,809,826,375,306,290,673,292,112,301,255,237,270,120,572,213,64])


correctores_inicial = 2
piso=6000
tope=45000
max_exam=100
porcentaje_hasta_tope= 1
pend= round((tope-piso)/(max_exam*porcentaje_hasta_tope),0)
porcen_corregir=0.5
# pend=200
agregan=1
divide_en_max=1
print('Piso: $',piso)
print('Tope: $',tope)
print('Maximo examen por corrector: ',max_exam)
print('Pendiente: $',pend)

results, total, df = tabla_costo_anual(correctores_inicial,piso,pend,tope,
                                     max_exam,dist_año,agregan,divide_en_max,porcen_corregir)

results['costo_por_examen'] = results.costo_total / results.EXAMENES_por_concurso
print('COSTO TOTAL del año: $',results.costo_total.sum())
print(f'\nPresupuesto: ${limite} - Costo nuevo: ${results.costo_total.sum()} \nRESULTADO= ${limite-results.costo_total.sum()} \nRESULTADO(%)= %{round((limite-results.costo_total.sum())/limite*100,2)}')
results.sort_values('EXAMENES_por_concurso')

Piso: $ 6000
Tope: $ 45000
Maximo examen por corrector:  100
Pendiente: $ 390.0
COSTO TOTAL del año: $ 1948110.0

Presupuesto: $3950000 - Costo nuevo: $1948110.0 
RESULTADO= $2001890.0 
RESULTADO(%)= %50.68


Unnamed: 0,ID,EXAMENES_por_concurso,correctores,exam_cada_uno,ganancia_cada_corrector,costo_total,costo_por_examen
19,19,32.0,2,32.0,18480.0,36960.0,1155.0
11,11,56.0,2,56.0,27840.0,55680.0,994.285714
16,16,60.0,2,60.0,29400.0,58800.0,980.0
18,18,106.5,2,53.0,26670.0,53340.0,500.84507
14,14,118.5,2,59.0,29010.0,58020.0,489.620253
13,13,127.5,2,63.0,30570.0,61140.0,479.529412
15,15,135.0,2,67.0,32130.0,64260.0,476.0
8,8,145.0,2,72.0,34080.0,68160.0,470.068966
10,10,146.0,2,73.0,34470.0,68940.0,472.191781
12,12,150.5,2,75.0,35250.0,70500.0,468.438538


In [49]:
piso_vec = [6000,8000]
tope_vec = [35000,40000,50000]
max_correccion_vec = [80,100,120]
divide_en_max_vec = [1,2]
correctores_inicial_vec = [2,3]
agregan_vec = [1,2]
porcen_corregir_vec = [1.0,0.5,0.35]
vec_params = [piso_vec,tope_vec,max_correccion_vec,divide_en_max_vec,correctores_inicial_vec,agregan_vec,porcen_corregir_vec]

# producto cartesiano
params = []
import itertools
for vec in itertools.product(*vec_params): # * unpackea la lista en distintos argumentos
    params.append(list(vec))
params = pd.DataFrame(params, columns=['piso','tope','max_correccion','divide_en_max','correctores_inicial','agregan','porcen_corregir'])
params['pend'] = round((params.tope-params.piso)/(params.max_correccion),0)
params['limite'] = limite

In [50]:
len(params)

432

In [38]:
RESULTADOS = armado_simulacion(params, dist_año, 20)


CANTIDAD DE CONCURSOS (ESCALADO): FIJO20

COMBINACION DE PARAMETROS NUMERO: 0

COMBINACION DE PARAMETROS NUMERO: 0

COMBINACION DE PARAMETROS NUMERO: 50

COMBINACION DE PARAMETROS NUMERO: 100

COMBINACION DE PARAMETROS NUMERO: 150

COMBINACION DE PARAMETROS NUMERO: 200

COMBINACION DE PARAMETROS NUMERO: 250

COMBINACION DE PARAMETROS NUMERO: 300

COMBINACION DE PARAMETROS NUMERO: 350

COMBINACION DE PARAMETROS NUMERO: 400

CANTIDAD DE CONCURSOS (ESCALADO): MITAD_MAS

COMBINACION DE PARAMETROS NUMERO: 0

COMBINACION DE PARAMETROS NUMERO: 0

COMBINACION DE PARAMETROS NUMERO: 50

COMBINACION DE PARAMETROS NUMERO: 100

COMBINACION DE PARAMETROS NUMERO: 150

COMBINACION DE PARAMETROS NUMERO: 200

COMBINACION DE PARAMETROS NUMERO: 250

COMBINACION DE PARAMETROS NUMERO: 300

COMBINACION DE PARAMETROS NUMERO: 350

COMBINACION DE PARAMETROS NUMERO: 400

CANTIDAD DE CONCURSOS (ESCALADO): DOBLE

COMBINACION DE PARAMETROS NUMERO: 0

COMBINACION DE PARAMETROS NUMERO: 0

COMBINACION DE PARAMETROS N

In [39]:
RESULTADOS

Unnamed: 0,piso,tope,max_correccion,divide_en_max,correctores_inicial,agregan,porcen_corregir,pend,limite,FIJO20_costo_bootstrap,...,MITAD_MAS_diferencia_limite_boot,MITAD_MAS_media_boot,MITAD_MAS_std_boot,MITAD_MAS_porcentaje_inferior_0,DOBLE_costo_bootstrap,DOBLE_media_costo,DOBLE_diferencia_limite_boot,DOBLE_media_boot,DOBLE_std_boot,DOBLE_porcentaje_inferior_0
0,6000,35000,80,1,2,1,1.00,362.0,3950000,"[3437572.0, 3356792.0]",...,"[-2040638.0, -2675918.0]",-2358278.0,317640.0,1.0,"[8296920.0, 7461084.0]",7879002.0,"[-4346920.0, -3511084.0]",-3929002.0,417918.0,1.0
1,6000,35000,80,1,2,1,0.50,362.0,3950000,"[1980682.0, 1780696.0]",...,"[1053526.0, 1030512.0]",1042019.0,11507.0,0.0,"[3855344.0, 4215858.0]",4035601.0,"[94656.0, -265858.0]",-85601.0,180257.0,0.5
2,6000,35000,80,1,2,1,0.35,362.0,3950000,"[1209236.0, 1391638.0]",...,"[2076570.0, 1767206.0]",1921888.0,154682.0,0.0,"[2914374.0, 2545434.0]",2729904.0,"[1035626.0, 1404566.0]",1220096.0,184470.0,0.0
3,6000,35000,80,1,2,2,1.00,362.0,3950000,"[3925012.0, 3990172.0]",...,"[-2171848.0, -1620744.0]",-1896296.0,275552.0,1.0,"[7190520.0, 7777824.0]",7484172.0,"[-3240520.0, -3827824.0]",-3534172.0,293652.0,1.0
4,6000,35000,80,1,2,2,0.50,362.0,3950000,"[2284856.0, 1283916.0]",...,"[645288.0, 456524.0]",550906.0,94382.0,0.0,"[4075496.0, 3652032.0]",3863764.0,"[-125496.0, 297968.0]",86236.0,211732.0,0.5
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
427,8000,50000,120,2,3,1,0.50,350.0,3950000,"[2689950.0, 2793650.0]",...,"[-266250.0, -38700.0]",-152475.0,113775.0,1.0,"[5717500.0, 5858350.0]",5787925.0,"[-1767500.0, -1908350.0]",-1837925.0,70425.0,1.0
428,8000,50000,120,2,3,1,0.35,350.0,3950000,"[2364500.0, 2616350.0]",...,"[249350.0, 263850.0]",256600.0,7250.0,0.0,"[4794400.0, 4837050.0]",4815725.0,"[-844400.0, -887050.0]",-865725.0,21325.0,1.0
429,8000,50000,120,2,3,2,1.00,350.0,3950000,"[4573750.0, 4450750.0]",...,"[-2914050.0, -1241400.0]",-2077725.0,836325.0,1.0,"[8713700.0, 8504050.0]",8608875.0,"[-4763700.0, -4554050.0]",-4658875.0,104825.0,1.0
430,8000,50000,120,2,3,2,0.50,350.0,3950000,"[2907000.0, 2799700.0]",...,"[-494400.0, -361100.0]",-427750.0,66650.0,1.0,"[5427350.0, 6078000.0]",5752675.0,"[-1477350.0, -2128000.0]",-1802675.0,325325.0,1.0


In [41]:
version = 2
params.to_csv(f'/Users/lucaspecina/Desktop/Planificacion Estrategica/Pagos jurados consejo magist/pagos-jurados/2021_simulaciones_{version}.csv',index=False)


In [42]:
#plotear_resultado(RESULTADOS,vec_params)

interactive(children=(Dropdown(description='tipo', options=('violin', 'hist'), value='violin'), Dropdown(descr…

<function __main__.plotear(tipo='violin', piso=6000, tope=40000, max_correccion=100, divide_en_max=1, correctores_inicial=2, agregan=1, porcen_corregir=1.0)>