Código disponível [na minha página do Github](https://github.com/arthurkenzo/atividades_ia525)

In [1]:
import cvxpy as cp
import numpy as np
import pandas as pd
import mosek
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import time
import networkx as nx
import random


from typing import Tuple
from itertools import product

## Definição do problema

• As aulas do curso são realizadas de segunda-feira a quinta-feira, das 19h às 23h.

• Duas turmas são conduzidas em paralelo ao longo do curso em cada ano.

• Em cada turma, os horários são fixos: as aulas de cada disciplina ocorrem sempre no mesmo dia da semana
para uma mesma turma. Note que turmas diferentes podem ter a mesma disciplina em dias diferentes.

• Em cada turma, cada dia de aula está associado a uma das disciplinas do curso: matemática, português, quı́mica
e fı́sica. Cada turma deve ter uma aula de cada disciplina.

• Cada dia de aula está dividido em dois blocos: aula teórica (19h-21h) e aula de exercı́cios (21h-23h).

• Os voluntários são selecionados por meio de processo especı́fico e são distribuı́dos em três papeis:
– Professor de teoria: responsável pela aula teórica de cada disciplina.
– Professor de exercı́cios: responsável pela aula de exercı́cios de cada disciplina.
– Monitor: responsável por apoiar o professor de exercı́cios na sua aula.

• A equipe de cada disciplina conta com dois professores de exercı́cios, dois professores de teoria e monitores
que devem ser alocados nos horários e distribuı́dos entre as turmas. Para uma mesma disciplina, o número de
monitores distribuı́dos entre as turmas deve ser aproximadamente igual. Cada turma fica com um professor de
cada tipo.

• A equipe de português é menor do que as demais. Assim, nas aulas de português, as duas turmas são unidas
em uma sala. Neste caso, ambos os professores de teoria podem trabalhar como professor de exercı́cios ou
monitor no segundo horário de aula. Nas demais disciplinas, cada voluntário atua em, no máximo, uma turma.

## Modelo

A modelagem consiste em dois conjuntos de variáveis de decisão: $x$ para definir os horários e turma dos voluntários, e $y$ para definir os horários e turma das disciplians. As relações entre voluntários e disciplinas será implementada por meio de restrições (talvez fosse possível incluir as disciplinas como uma dimensão a mais em $x$, mas comecei assim e achei que não valeria a pena reformular tudo). 

De forma a reduzir o número de variáveis criadas, geraremos variáveis apenas para casos de factibilidade garantida: por exemplo, não geraremos variáveis para alocar professores de teoria às 21h, pois aulas teóricas sempre ocorrem no primeiro horário. Igualmente, criamos variáveis de alocação de voluntários apenas para os horários marcados como disponíveis na planilha de disponibilidade para cada voluntário. 

A distribuição equilibrada de monitores pode ser feita por meio de uma função objetivo que minimiza a soma das diferenças entre a média ideal de monitores por turma (possível de se calcular previamente) e o número de monitores alocados em cada disciplina, turma e horário.

TODO: resta ainda modelar o caso especial da disciplina de português e a distribuição de monitores no objetivo.

\begin{align*}
    \text{Variáveis de decisão:} \quad &  x_{vdhg}\in\mathbb{B} \hspace{20pt} \text{(Alocar voluntário } v \text{ no dia } d \text{, no horário }h\text{, e na turma }g\text{)} \\
                                 \quad &  y_{sdg}\in\mathbb{B}  \hspace{20pt} \text{(Alocar disciplina } s \text{ no dia } d\text{, e na turma }g\text{)} \\

    \text{Encontrar }   & x_{vdhg}, y_{sdg}\\

    \text{sujeito a }   & \sum_{d,h,g} x_{vdhg} = 1 \quad \forall  v  \hspace{20pt} \text{(Alocar apenas um horário para cada voluntário)} \\
                        & \sum_{v} x_{vdhg} = 1 \quad \forall  d,h,g  \hspace{20pt} \text{(Alocar apenas um voluntário em cada horário)} \\

                        & \sum_{s} y_{sdg} \quad \forall d,g  \hspace{20pt} \text{(Apenas uma disciplina para cada dia, para cada grupo)} \\
                        & \sum_{x\notin P_s} x_{vdhg} + y_{sdg} \quad \forall s,d,g  \hspace{20pt} \text{(Se a disciplina } s \text{ for dada em um horário, não alocar professores de outras disciplinas)} \\
                        & \\
    \text{onde} \\
                        & P_s \text{ é o conjunto de voluntários associados à disciplina }s  \\
\end{align*}

No modelo acima, a menos que especificado na notação, todos os somatórios são sobre os conjuntos inteiros aos quais pertencem cada índice (por exemplo, $\sum_d$ é uma soma sobre todos os voluntários).

## Implementação

In [2]:
# loading dataset into a pandas dataframe
availab = pd.read_csv('dados_exato.csv')
# fill empty cells with zeros
availab.fillna(0, inplace=True)
# index entries with strings
availab.index = [f'v{i}' for i in range(len(availab))]

pd.set_option('display.expand_frame_repr', False) 
print("Pre-processed DataFrame:\n", availab.head())


Pre-processed DataFrame:
    area     cargo  seg19  seg21  ter19  ter21  qua19  qua21  qui19  qui21
v0  mat  p_teoria    0.0    1.0    0.0    1.0    1.0    0.0    1.0    0.0
v1  mat   monitor    0.0    1.0    0.0    0.0    0.0    0.0    0.0    0.0
v2  mat   monitor    0.0    1.0    0.0    1.0    0.0    0.0    1.0    0.0
v3  mat   monitor    0.0    0.0    1.0    1.0    0.0    0.0    1.0    1.0
v4  mat   monitor    0.0    0.0    0.0    0.0    1.0    1.0    0.0    0.0


In [3]:
subjects = ['port', 'mat', 'fis', 'quim']
days = ['seg', 'ter', 'qua', 'qui']
shifts = ['19', '21']
groups = ['1', '2']
voluntiers = [f'v{i}' for i in range(len(availab))]

# create a dictionary with subjects as keys and voluntiers as values
voluntiersBySubject = {}
for subject in subjects:
    voluntiersBySubject[subject] = availab[availab['area'] == subject].index.tolist()

theoryProfs = availab[availab['cargo'] == 'p_teoria'].index.tolist()
practiceProfs = availab[availab['cargo'] == 'p_exerc'].index.tolist()
assistants = availab[availab['cargo'] == 'monitor'].index.tolist()
practiceVoluntiers = practiceProfs + assistants

In [4]:
nbVars = 0
# generate dictionary for indexing decision variables
allocationVars = {}
for voluntier in voluntiers:
    allocationVars[voluntier] = {}

    for day in days:
        allocationVars[voluntier][day] = {}

        for shift in shifts:
            allocationVars[voluntier][day][shift] = {}

            for group in groups:
                # do not create variables for theory profs on the second shift
                if shift == '21' and voluntier in theoryProfs:
                    break
                # do not create variables for practice profs and assistants on the first shift
                if shift == '19' and (voluntier in practiceVoluntiers):
                    break
                # generate variables only for feasible hours based on availability table
                if availab.loc[voluntier, day+shift] == 1:
                    allocationVars[voluntier][day][shift][group] = cp.Variable(boolean=True, name=f'aloc_{voluntier}_{day}_{shift}_{group}')
                    nbVars += 1

subjectIndicators = {}
for subject in subjects:
    subjectIndicators[subject] = {}
    for day in days:
        subjectIndicators[subject][day] = {}
        for group in groups:
            subjectIndicators[subject][day][group] = cp.Variable(boolean=True, name=f'indic_{subject}_{day}_{group}')


print(f"Variáveis geradas: {nbVars}")


Variáveis geradas: 216


In [5]:
# funções de manipulação de dicionários geradas com ajuda do nosso amigo chat gpt

def CollectNestedValues(d, target_key):
    results = []
    if isinstance(d, dict):
        for k, v in d.items():
            if k == target_key:
                results.append(v)
            if isinstance(v, dict):
                results.extend(CollectNestedValues(v, target_key))
            elif isinstance(v, list):
                for item in v:
                    results.extend(CollectNestedValues(item, target_key))
    return results

def GetAllValuesByKey(nestedDict, targetKey):
    results = []
    if isinstance(nestedDict, dict):
        for key, value in nestedDict.items():
            if key == targetKey:
                results.append(value)
            if isinstance(value, dict):
                results.extend(GetAllValuesByKey(value, targetKey))
            elif isinstance(value, list):
                for item in value:
                    results.extend(GetAllValuesByKey(item, targetKey))
    return results

def VolunteersWithVarsOn(allocationVars, targetDay, targetShift, targetGroup):
    matchingVolunteers = []

    for volunteer, dayDict in allocationVars.items():
        shiftDict = dayDict.get(targetDay, {}).get(targetShift, {})
        if targetGroup in shiftDict:
            matchingVolunteers.append(volunteer)

    return matchingVolunteers

In [6]:
constraints = []

#TODO: faz sentido deixar a restrição como "<=" para perimitir voluntarios não alocados?
# only one shift per voluntier
for voluntier in voluntiers:
    # list of all days and shifts where the current voluntier is available
    shiftsAvailable = [allocationVars[voluntier][day][shift] 
                        for day in allocationVars.get(voluntier, {}) 
                        for shift in allocationVars[voluntier].get(day, {})]
    if shiftsAvailable:
        #TODO: fix to include groups
        # constraints += [cp.sum(shiftsAvailable) == 1]
        pass


# exactly one voluntier per shift
for day in days:
    for shift in shifts:
        for group in groups:
            # list of all voluntiers having a variable associated to the current day, shift and group
            voluntiersAvailable = VolunteersWithVarsOn(allocationVars, day, shift, group)
            if voluntiersAvailable:
                #TODO: fix to include groups
                # constraints += [cp.sum(voluntiersAvailable) == 1]
                pass


# exactly one subject per day per group
for subject in subjects:
    for group in groups:
        # constraints += [cp.sum([subjectIndicators[subject][day][group] for day in days]) == 1]
        pass


# at each group, if subject i is allocated to day j, do not allocate any voluntiers of other subjects to this day
for subject in subjects:
    for day in days:
        for group in groups:
            # collect the keys for all voluntiers that cannot teach the current subject
            prohibitedVoluntiers = [index for _subject in voluntiersBySubject 
                                    if _subject != subject 
                                    for index in voluntiersBySubject[_subject] ]
            
            # collect all alocation variables corresponding to the prohibited voluntiers 
            prohibitedAllocations = []
            for prohibitedVol in prohibitedVoluntiers:
                prohibitedAllocations.extend(GetAllValuesByKey(allocationVars[prohibitedVol], group))

            constraints += [subjectIndicators[subject][day][group] + cp.sum(prohibitedAllocations) == 1]
            pass

    

# alocate teaching assistants evenly among the practice shifts
objective = cp.Minimize(0) 


In [7]:
# solving
lp = cp.Problem(objective, constraints)


## Rascunho

In [8]:
print(lp)

minimize 0.0
subject to indic_port_seg_1 + aloc_v0_qua_19_1 + aloc_v0_qui_19_1 + aloc_v1_seg_21_1 + aloc_v2_seg_21_1 + aloc_v2_ter_21_1 + aloc_v3_ter_21_1 + aloc_v3_qui_21_1 + aloc_v4_qua_21_1 + aloc_v5_qui_21_1 + aloc_v6_seg_19_1 + aloc_v6_ter_19_1 + aloc_v6_qua_19_1 + aloc_v6_qui_19_1 + aloc_v7_seg_21_1 + aloc_v7_ter_21_1 + aloc_v7_qui_21_1 + aloc_v8_seg_21_1 + aloc_v9_seg_21_1 + aloc_v9_ter_21_1 + aloc_v9_qui_21_1 + aloc_v10_ter_21_1 + aloc_v10_qua_21_1 + aloc_v11_seg_21_1 + aloc_v11_ter_21_1 + aloc_v11_qua_21_1 + aloc_v11_qui_21_1 + aloc_v12_seg_21_1 + aloc_v12_ter_21_1 + aloc_v12_qua_21_1 + aloc_v12_qui_21_1 + aloc_v13_seg_21_1 + aloc_v13_qua_21_1 + aloc_v14_qua_21_1 + aloc_v15_seg_21_1 + aloc_v15_ter_21_1 + aloc_v15_qua_21_1 + aloc_v16_seg_21_1 + aloc_v16_ter_21_1 + aloc_v16_qua_21_1 + aloc_v30_seg_21_1 + aloc_v30_ter_21_1 + aloc_v30_qua_21_1 + aloc_v31_seg_21_1 + aloc_v31_ter_21_1 + aloc_v32_seg_19_1 + aloc_v32_ter_19_1 + aloc_v32_qua_19_1 + aloc_v32_qui_19_1 + aloc_v33_qua_21_1

In [9]:
for subject in subjects:
    all_volunteers = set().union(*voluntiersBySubject.values())

    # Remove indexes for excluded subject
    # filtered_indexes = list(all_volunteers - set(subjectIndexes.get(subject, [])))
    filtered_indexes = [
    idx 
    for _subject in voluntiersBySubject 
    if _subject != subject 
    for idx in voluntiersBySubject[_subject]  # Keeps duplicates if they exist
]
    print(filtered_indexes)

['v0', 'v1', 'v2', 'v3', 'v4', 'v5', 'v6', 'v7', 'v8', 'v9', 'v10', 'v11', 'v12', 'v13', 'v14', 'v15', 'v16', 'v30', 'v31', 'v32', 'v33', 'v34', 'v35', 'v36', 'v37', 'v38', 'v39', 'v40', 'v41', 'v42', 'v21', 'v22', 'v23', 'v24', 'v25', 'v26', 'v27', 'v28', 'v29']
['v17', 'v18', 'v19', 'v20', 'v30', 'v31', 'v32', 'v33', 'v34', 'v35', 'v36', 'v37', 'v38', 'v39', 'v40', 'v41', 'v42', 'v21', 'v22', 'v23', 'v24', 'v25', 'v26', 'v27', 'v28', 'v29']
['v17', 'v18', 'v19', 'v20', 'v0', 'v1', 'v2', 'v3', 'v4', 'v5', 'v6', 'v7', 'v8', 'v9', 'v10', 'v11', 'v12', 'v13', 'v14', 'v15', 'v16', 'v21', 'v22', 'v23', 'v24', 'v25', 'v26', 'v27', 'v28', 'v29']
['v17', 'v18', 'v19', 'v20', 'v0', 'v1', 'v2', 'v3', 'v4', 'v5', 'v6', 'v7', 'v8', 'v9', 'v10', 'v11', 'v12', 'v13', 'v14', 'v15', 'v16', 'v30', 'v31', 'v32', 'v33', 'v34', 'v35', 'v36', 'v37', 'v38', 'v39', 'v40', 'v41', 'v42']
