In [33]:
import pandas as pd

# Preprocesamiento

In [34]:
df = pd.read_csv('./Resources/data.csv')

In [35]:
df.head()

Unnamed: 0,id,estado,antiguedad,modalidad,value
0,1,Chihuahua,1.0,b.\tDistancia,Selección de personal
1,2,Coahuila,0.0,a.\tPresencial,Diseño de programas de capacitación
2,3,Coahuila,10.0,b.\tDistancia,Construcción de la cartografía electoral
3,4,Coahuila,8.0,b.\tDistancia,Operación de las comisiones de vigilancia del ...
4,5,Coahuila,3.0,a.\tPresencial,"Planeación de planes, programas y proyectos"


Mapear las modalidades a variables numericas enteras.

In [36]:
mapping = {"a.\tPresencial": 0, "b.\tDistancia": 1, "c.\tMixta": 2}
df['modalidad'] = df['modalidad'].replace(mapping)
df.head()

  df['modalidad'] = df['modalidad'].replace(mapping)


Unnamed: 0,id,estado,antiguedad,modalidad,value
0,1,Chihuahua,1.0,1,Selección de personal
1,2,Coahuila,0.0,0,Diseño de programas de capacitación
2,3,Coahuila,10.0,1,Construcción de la cartografía electoral
3,4,Coahuila,8.0,1,Operación de las comisiones de vigilancia del ...
4,5,Coahuila,3.0,0,"Planeación de planes, programas y proyectos"


Filtar los datos por modalidad a distancia y agrupar los cursos con su respectiva demanda.

In [37]:
demanda = df[df['modalidad'] == 1].drop(columns=['modalidad'])
demanda.rename(columns={'value': 'curso'}, inplace=True)
demanda.head(15)

Unnamed: 0,id,estado,antiguedad,curso
0,1,Chihuahua,1.0,Selección de personal
2,3,Coahuila,10.0,Construcción de la cartografía electoral
3,4,Coahuila,8.0,Operación de las comisiones de vigilancia del ...
5,6,Chihuahua,30.0,Registro de actos de partidos y agrupaciones p...
7,8,Aguascalientes,8.0,Determinación de financiamiento público a part...
8,9,Campeche,0.0,Distribución de documentación y material elect...
9,10,Puebla,1.0,Administración de base de datos
10,11,Veracruz,1.5,Operación de las comisiones de vigilancia del ...
12,13,Guanajuato,7.0,Registro de actos de partidos y agrupaciones p...
13,14,Veracruz,13.0,Administración de base de datos


In [38]:
cursos = demanda['curso'].value_counts().reset_index()
cursos.columns = ['curso', 'counts']
cursos

Unnamed: 0,curso,counts
0,Atención de asuntos jurídicos,235
1,"Aplicación y gestión de recursos humanos, mate...",190
2,Selección de personal,170
3,Operación de las comisiones de vigilancia del ...,156
4,Administración de base de datos,145
5,Actualización del padrón electoral y credencia...,132
6,Construcción de la cartografía electoral,129
7,Depuración del padrón electoral,127
8,Fiscalización a los sujetos obligados,127
9,Impartición de capacitación,121


Estructuras de datos para el algoritmo

In [39]:
# Ordenar dataframe O(nlogn)
cursos = cursos.sort_values(by=['counts'], ascending=False)
# Join de demanda con cursos (Investigar complejidad) Se agrego columna counts para ordenar
demanda = demanda.merge(cursos, on='curso', how='left')
# Ordenar dataframe O(nlogn)
demanda = demanda.sort_values(by=['counts', 'curso', 'antiguedad'], ascending=False)
# Investigar complejidad de drop
demanda.drop(columns=['counts'], inplace=True)
# Estructuras de datos
lista_demanda = demanda.to_dict(orient='records')
lista_cursos = cursos.to_dict(orient='records')

In [40]:
lista_demanda[:5]

[{'id': 1422,
  'estado': 'Guanajuato',
  'antiguedad': 36.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 1719,
  'estado': 'Ciudad de México',
  'antiguedad': 32.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 385,
  'estado': 'Jalisco',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 563,
  'estado': 'México',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 125,
  'estado': 'Yucatán',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'}]

In [41]:
lista_cursos[:5]

[{'curso': 'Atención de asuntos jurídicos', 'counts': 235},
 {'curso': 'Aplicación y gestión de recursos humanos, materiales y financieros',
  'counts': 190},
 {'curso': 'Selección de personal', 'counts': 170},
 {'curso': 'Operación de las comisiones de vigilancia del registro federal de electores',
  'counts': 156},
 {'curso': 'Administración de base de datos', 'counts': 145}]

# Algoritmo

**Problema.** Dado un número de $N$ grupos de tamano $n$ (la capacidad de asistentes a cada grupo); se busca asignar los lugares de los cursos a los trabajadores del INE, de manera que se priorice a los trabajadores con mayor antigüedad.

1. El algoritmo determinará si es posible colocar a los trabajadores con la configuración de cursos establecida. De no ser posible, se asignará un valor de $-1$ a las solicitudes que no pudieron tener un grupo asignado.

2. Devolverá un diccionario con los ids de los trabajadores, su estado, su antiguedad y el grupo del curso que les fue asignado. Se busca que se llenen los grupos y no queden lugares vacios.

**Entradas.**
- Una lista con diccionarios que contienen el nombre de un curso y el conteo de la demanda de dicho curso. Se asume que la lista esta ordenada con respecto al conteo de los cursos de mayor a menor.
- Una lista con diccionarios que contienen los datos de un trabajador del INE y el curso que solicita tomar. Se asume que la lista esta ordenada con respecto al curso con mayor demanda y por mayor antiguedad.
- $N>0$: Numero de grupos disponibles
- $n>0$: Capacidad de asistentes en cada grupo del curso.

**Salidas.**
- Mensaje que indica si no posible la asignación de todos los trabajadores en los cursos.
- Diccionario con la asignacion de trabajadores con los grupos de los cursos que les corresponde (o $-1$ si no pudo tener un grupo asignado).

In [42]:
def asignar_cursos(lista_cursos: list[dict], lista_demanda: list[dict], N: int, n: int) -> dict:
    # Inicializar diccionario de asignaciones
    asignaciones = {'id_trabajador': [], 'estado': [], 'antiguedad': [], 'curso': [], 'curso_id': []}

    # Inicializar variables
    grupo_id = 1
    residuos = []  # Para guardar las asignaciones residuales después de llenar los grupos

    # Primera ronda: Asignación principal por grupos del tamaño de n
    for curso in lista_cursos:
        curso_actual = curso['curso']
        demanda_restante = curso['counts']

        # Asignar trabajadores por grupos de tamaño n
        while demanda_restante >= n and N > 0:
            lugares_por_asignar = n
            if lugares_por_asignar <= demanda_restante:
                for _ in range(lugares_por_asignar):
                    if not lista_demanda:
                        break
                    row = lista_demanda.pop(0)
                    asignaciones['id_trabajador'].append(row['id'])
                    asignaciones['estado'].append(row['estado'])
                    asignaciones['antiguedad'].append(row['antiguedad'])
                    asignaciones['curso'].append(curso_actual)
                    asignaciones['curso_id'].append(grupo_id)

                # Restar la cantidad de trabajadores asignados del total de demanda
                demanda_restante -= lugares_por_asignar
                grupo_id += 1
                N -= 1  # Un grupo menos disponible

            # Si no se pueden llenar los grupos completos, guardar los residuos
            if demanda_restante < n:
                residuos.append({'curso': curso_actual, 'counts': demanda_restante})
                break

    # Segunda ronda: Asignación de residuos
    residuos = sorted(residuos, key=lambda x: x['counts'], reverse=True)

    for residuo in residuos:
        curso_actual = residuo['curso']
        demanda_restante = residuo['counts']

        while demanda_restante > 0 and N > 0:
            lugares_por_asignar = min(n, demanda_restante)  # Se asignan los lugares restantes según lo disponible
            for _ in range(lugares_por_asignar):
                if not lista_demanda:
                    break
                row = lista_demanda.pop(0)
                asignaciones['id_trabajador'].append(row['id'])
                asignaciones['estado'].append(row['estado'])
                asignaciones['antiguedad'].append(row['antiguedad'])
                asignaciones['curso'].append(curso_actual)
                asignaciones['curso_id'].append(grupo_id)

            # Restar la cantidad de trabajadores asignados del total de demanda
            demanda_restante -= lugares_por_asignar
            grupo_id += 1
            N -= 1  # Un grupo menos disponible

    # Asignar curso_id = -1 para los trabajadores que no se pudieron asignar
    for row in lista_demanda:
        asignaciones['id_trabajador'].append(row['id'])
        asignaciones['estado'].append(row['estado'])
        asignaciones['antiguedad'].append(row['antiguedad'])
        asignaciones['curso'].append(curso_actual)
        asignaciones['curso_id'].append(-1)

    # Imprimir advertencia si hay trabajadores sin asignar
    if lista_demanda:
        print('Advertencia: No fue posible asignar cursos a todos los trabajadores')
    return asignaciones


In [43]:
N = 160
n = 20

In [44]:
asignaciones = asignar_cursos(lista_cursos, lista_demanda, N, n)

Advertencia: No fue posible asignar cursos a todos los trabajadores


In [45]:
pd.DataFrame(asignaciones).head(30)

Unnamed: 0,id_trabajador,estado,antiguedad,curso,curso_id
0,1422,Guanajuato,36.0,Atención de asuntos jurídicos,1
1,1719,Ciudad de México,32.0,Atención de asuntos jurídicos,1
2,385,Jalisco,31.0,Atención de asuntos jurídicos,1
3,563,México,31.0,Atención de asuntos jurídicos,1
4,125,Yucatán,31.0,Atención de asuntos jurídicos,1
5,454,Michoacán,31.0,Atención de asuntos jurídicos,1
6,1039,Nuevo León,31.0,Atención de asuntos jurídicos,1
7,1794,Morelos,31.0,Atención de asuntos jurídicos,1
8,754,Ciudad de México,31.0,Atención de asuntos jurídicos,1
9,764,Nuevo León,31.0,Atención de asuntos jurídicos,1


In [46]:
pd.DataFrame(asignaciones).to_csv('asignaciones.csv', index=False)