In [1]:
import pandas as pd

# Preprocesamiento

In [2]:
df = pd.read_csv('./Resources/data.csv')

In [3]:
df.head()

Unnamed: 0,id,estado,antiguedad,modalidad,value
0,1,Chihuahua,1.0,b.\tDistancia,Selección de personal
1,2,Coahuila,0.0,a.\tPresencial,Diseño de programas de capacitación
2,3,Coahuila,10.0,b.\tDistancia,Construcción de la cartografía electoral
3,4,Coahuila,8.0,b.\tDistancia,Operación de las comisiones de vigilancia del ...
4,5,Coahuila,3.0,a.\tPresencial,"Planeación de planes, programas y proyectos"


Mapear las modalidades a variables numericas enteras.

In [4]:
mapping = {"a.\tPresencial": 0, "b.\tDistancia": 1, "c.\tMixta": 2}
df['modalidad'] = df['modalidad'].replace(mapping)
df.head()

  df['modalidad'] = df['modalidad'].replace(mapping)


Unnamed: 0,id,estado,antiguedad,modalidad,value
0,1,Chihuahua,1.0,1,Selección de personal
1,2,Coahuila,0.0,0,Diseño de programas de capacitación
2,3,Coahuila,10.0,1,Construcción de la cartografía electoral
3,4,Coahuila,8.0,1,Operación de las comisiones de vigilancia del ...
4,5,Coahuila,3.0,0,"Planeación de planes, programas y proyectos"


Filtar los datos por modalidad a distancia y agrupar los cursos con su respectiva demanda.

In [5]:
demanda = df[df['modalidad'] == 1].drop(columns=['modalidad'])
demanda.rename(columns={'value': 'curso'}, inplace=True)
demanda.head(15)

Unnamed: 0,id,estado,antiguedad,curso
0,1,Chihuahua,1.0,Selección de personal
2,3,Coahuila,10.0,Construcción de la cartografía electoral
3,4,Coahuila,8.0,Operación de las comisiones de vigilancia del ...
5,6,Chihuahua,30.0,Registro de actos de partidos y agrupaciones p...
7,8,Aguascalientes,8.0,Determinación de financiamiento público a part...
8,9,Campeche,0.0,Distribución de documentación y material elect...
9,10,Puebla,1.0,Administración de base de datos
10,11,Veracruz,1.5,Operación de las comisiones de vigilancia del ...
12,13,Guanajuato,7.0,Registro de actos de partidos y agrupaciones p...
13,14,Veracruz,13.0,Administración de base de datos


In [6]:
cursos = demanda['curso'].value_counts().reset_index()
cursos.columns = ['curso', 'counts']
cursos

Unnamed: 0,curso,counts
0,Atención de asuntos jurídicos,235
1,"Aplicación y gestión de recursos humanos, mate...",190
2,Selección de personal,170
3,Operación de las comisiones de vigilancia del ...,156
4,Administración de base de datos,145
5,Actualización del padrón electoral y credencia...,132
6,Construcción de la cartografía electoral,129
7,Depuración del padrón electoral,127
8,Fiscalización a los sujetos obligados,127
9,Impartición de capacitación,121


Estructuras de datos para el algoritmo

In [7]:
cursos = cursos.sort_values(by=['counts'], ascending=False)
demanda = demanda.merge(cursos, on='curso', how='left')
demanda = demanda.sort_values(by=['counts', 'curso', 'antiguedad'], ascending=False)
demanda.drop(columns=['counts'], inplace=True)
# Estructuras de datos
lista_demanda = demanda.to_dict(orient='records')
lista_cursos = cursos.to_dict(orient='records')

Previews

In [8]:
lista_demanda

[{'id': 1422,
  'estado': 'Guanajuato',
  'antiguedad': 36.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 1719,
  'estado': 'Ciudad de México',
  'antiguedad': 32.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 385,
  'estado': 'Jalisco',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 563,
  'estado': 'México',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 125,
  'estado': 'Yucatán',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 454,
  'estado': 'Michoacán',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 1039,
  'estado': 'Nuevo León',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 1794,
  'estado': 'Morelos',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 754,
  'estado': 'Ciudad de México',
  'antiguedad': 31.0,
  'curso': 'Atención de asuntos jurídicos'},
 {'id': 764,
  'estado': 'Nuevo León',
  'an

In [9]:
lista_cursos

[{'curso': 'Atención de asuntos jurídicos', 'counts': 235},
 {'curso': 'Aplicación y gestión de recursos humanos, materiales y financieros',
  'counts': 190},
 {'curso': 'Selección de personal', 'counts': 170},
 {'curso': 'Operación de las comisiones de vigilancia del registro federal de electores',
  'counts': 156},
 {'curso': 'Administración de base de datos', 'counts': 145},
 {'curso': 'Actualización del padrón electoral y credencialización de los ciudadanos',
  'counts': 132},
 {'curso': 'Construcción de la cartografía electoral', 'counts': 129},
 {'curso': 'Depuración del padrón electoral', 'counts': 127},
 {'curso': 'Fiscalización a los sujetos obligados', 'counts': 127},
 {'curso': 'Impartición de capacitación', 'counts': 121},
 {'curso': 'Operación de módulos de atención ciudadana', 'counts': 113},
 {'curso': 'Planeación de planes, programas y proyectos', 'counts': 113},
 {'curso': 'Aplicación de metodología estadística y/o demográfica',
  'counts': 111},
 {'curso': 'Seguimient

# Algoritmo

**Problema.** Dado un número $N$ de grupos con tamaños $n_i$ (la capacidad máxima del $i$-ésimo grupo), se busca asignar los lugares en cursos a los trabajadores del INE de manera que se priorice a los trabajadores con mayor antigüedad y se maximice la utilización de los grupos. Si no es posible asignar a todos los trabajadores con la configuración dada, se les marcará con un valor de $-1$.

1. El algoritmo debe determinar si es posible colocar a los trabajadores con la configuración de cursos establecida. De no ser posible, se asignar un valor de $-1$ a las solicitudes que no pudieron tener un grupo asignado.

2. Debe devolver un diccionario con los ids de los trabajadores, su estado, su antiguedad y el grupo del curso que les fue asignado. Se busca que se llenen los grupos y no queden lugares vacios.

**Entradas.**
- Una lista con diccionarios que contienen el nombre de un curso y la demanda asociada. La lista debe estar preordenada por demanda de mayor a menor.
- Una lista con diccionarios que contienen los datos de cada trabajador del INE, incluyendo el curso solicitado. La lista debe estar preordenada por curso (según la demanda) y por antigüedad descendente.
- $N>0$: Numero de grupos disponibles
- $n$: Lista de capacidad de asistentes en cada grupo del curso. $n_i>0 \quad \forall i \in \{1,...,N\} $

**Salidas.**
- Mensaje que indica si no posible la asignación de todos los trabajadores en los cursos.
- Diccionario con la asignacion de trabajadores con los grupos de los cursos que les corresponde (o $-1$ si no pudo tener un grupo asignado). El diccionario contiene:
    1. id de trabajador
    2. Estado
    3. Antiguedad
    4. Curso solicitado
    5. id de grupo asignado (o $-1$ en su defecto)

In [10]:
def asignar_grupos(lista_demanda, lista_cursos, N, tamanos_grupos):
    # Variables iniciales
    grupos = [[] for _ in range(N)]
    resultado = {'id_trabajador': [], 'estado': [], 'antiguedad': [], 'curso': [], 'curso_id': []}
    cursos_por_grupo = [None for _ in range(N)]
    no_asignados = 0

    # Iteramos sobre los trabajadores ordenados por antiguedad
    lista_demanda = sorted(lista_demanda, key=lambda x: -x['antiguedad'])
    for trabajador in lista_demanda:
        id_trabajador = trabajador['id']
        estado = trabajador['estado']
        antiguedad = trabajador['antiguedad']
        curso = trabajador['curso']
        # Se intenta asignar al trabajador al grupo más adecuado
        asignado = False
        for i in range(N):
            if len(grupos[i]) < tamanos_grupos[i]:
                if cursos_por_grupo[i] is None or cursos_por_grupo[i] == curso:
                    grupos[i].append(id_trabajador)
                    cursos_por_grupo[i] = curso
                    resultado['id_trabajador'].append(id_trabajador)
                    resultado['estado'].append(estado)
                    resultado['antiguedad'].append(antiguedad)
                    resultado['curso'].append(curso)
                    resultado['curso_id'].append(i + 1)
                    asignado = True
                    break
        # Si no se asignó, agregar con grupo_id = -1
        if not asignado:
            resultado['id_trabajador'].append(id_trabajador)
            resultado['estado'].append(estado)
            resultado['antiguedad'].append(antiguedad)
            resultado['curso'].append(curso)
            resultado['curso_id'].append(-1)
            no_asignados += 1

    # Resumen numerico de los grupos
    ocupacion_grupos = [len(grupo) for grupo in grupos]
    # Hay trabajadores no asignados
    if no_asignados > 0:
        print("Advertencia: No fue posible asignar cursos a todos los trabajadores.")
    print(f"Resumen de ocupación de grupos: {ocupacion_grupos}")
    print(f"Trabajadores no asignados: {no_asignados}")
    return resultado

Probaremos con 160 grupos de 20 personas.

In [11]:
N = 160
n = [20] * N

In [12]:
asignaciones = asignar_grupos(lista_demanda, lista_cursos, N, n)

Advertencia: No fue posible asignar cursos a todos los trabajadores.
Resumen de ocupación de grupos: [20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 4, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 16, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 17, 20, 20, 17, 20, 20, 20, 20, 20, 12, 20, 20, 20, 11, 12, 12, 9, 10, 20, 13, 12, 20, 13, 10]
Trabajadores no asignados: 114


In [13]:
cursos_df = pd.DataFrame(asignaciones)

In [14]:
num_grupo = int(input("Ingrese el número de grupo para visualizar: "))
cursos_df[cursos_df['curso_id'] == num_grupo]

Unnamed: 0,id_trabajador,estado,antiguedad,curso,curso_id
23,1258,México,32.0,Selección de personal,9
117,385,Jalisco,31.0,Selección de personal,9
118,754,Ciudad de México,31.0,Selección de personal,9
119,801,Guanajuato,31.0,Selección de personal,9
120,1030,México,31.0,Selección de personal,9
121,1200,Aguascalientes,31.0,Selección de personal,9
122,591,Guerrero,31.0,Selección de personal,9
123,1067,México,31.0,Selección de personal,9
124,1190,Guanajuato,31.0,Selección de personal,9
125,1342,Yucatán,31.0,Selección de personal,9


Crear y escribir archivo csv

In [15]:
pd.DataFrame(asignaciones).to_csv('./Output/asignaciones.csv', index=False)