# TODOs

- ✓ def solve => def get_instance, returner problem i stedet for løsning. Bl.a. mulighed for at få feasibility.
- ✓ def get_task_counts, laver stats matrix
- ✓ arg sick => arg hu + arg sick
- ✓ arg df => arg task_counts
- ✓ arg assigned
- ✓ løs for hel dag
- ✓ tilføj constraints i prob
- check conflicts, e.g. 
- tilføj vagthavende constraint
- tilføj allerede assigned constraint
- ekskluder tasks for dags dato i statistik, måske via pre-filter på df
- Tjek at dag udfyldt korrekt via solution feasibility (giv alle assignments med som argument)

## Create synthetic data

In [31]:
MAX_SICK = 2
N_GASTS = 60
N_TEAMS = 3
N_SHIFTS = 6
N_TASKS = len(Task)
TEAM_SIZE = 20
TEAM_ORDER = [0,1,2]
N_GASTS = 60
N_TEAMS = 3
N_SHIFTS = 6
N_TASKS = len(Task)
TEAM_SIZE = 20
TEAM_ORDER = [0,1,2]
KABYS_TIDER = [0,1,2]
PEJLE_SHIFT = 3


dates = pd.date_range(start='3/1/2021', end='3/14/2021').date

history = []
np.random.seed(42)

for dt in dates:
    for shift in range(N_SHIFTS):
        n_sick = np.random.randint(0,MAX_SICK)
        sick = np.random.choice(N_GASTS, n_sick)
        team = TEAM_ORDER[shift % N_TEAMS]
        min_gast, max_gast = team_minmax(team)
        active_gasts = [gast for gast in range(min_gast, max_gast) if gast not in sick]
        for task_no, gast_no in enumerate(np.random.permutation(active_gasts)[:N_TASKS]):
            task_name = Task(task_no).name
            entry = {'date': dt, 'shift': shift, 'gast_no': gast_no, 'task_no': task_no, 'task_name': task_name}
            history.append(entry)
        for gast_no in sick:
            entry = {'date': dt, 'shift': shift, 'gast_no': gast_no, 'task_no': -1, 'task_name': 'SICK'}
            history.append(entry)
df = pd.DataFrame(history)
df.to_csv('../data/synthetic.csv', index=False)
df

Unnamed: 0,date,shift,gast_no,task_no,task_name
0,2021-03-01,0,0,0,VAGTHAVENDE_ELEV
1,2021-03-01,0,17,1,ORDONNANS
2,2021-03-01,0,15,2,UDKIG
3,2021-03-01,0,1,3,BJÆRGEMÆRS
4,2021-03-01,0,8,4,RORGÆNGER
...,...,...,...,...,...
1039,2021-03-14,5,53,8,UDSÆTNINGSGAST_D
1040,2021-03-14,5,57,9,PEJLEGAST_A
1041,2021-03-14,5,50,10,PEJLEGAST_B
1042,2021-03-14,5,44,11,DÆKSELEV_I_KABYS


## Load data

In [32]:
df = pd.read_csv('../data/synthetic.csv')

## Library

In [143]:
from enum import Enum
from itertools import product

import numpy as np
import pandas as pd
import pulp as P

class Task(Enum):
    VAGTHAVENDE_ELEV = 0
    ORDONNANS = 1
    UDKIG = 2
    BJÆRGEMÆRS = 3
    RORGÆNGER = 4
    UDSÆTNINGSGAST_A = 5
    UDSÆTNINGSGAST_B = 6
    UDSÆTNINGSGAST_C = 7
    UDSÆTNINGSGAST_D = 8
    PEJLEGAST_A = 9
    PEJLEGAST_B = 10
    DÆKSELEV_I_KABYS = 11

def team_minmax(team, size=20):
    return team*size, team*size+size

def get_task_counts(df_log, n_gasts=60):
    n_tasks = len(Task)
    hist = df[df.task_no >= 0].groupby(['gast_no', 'task_no']).size()
    stats = np.zeros((n_gasts, n_tasks)).astype(int)
    for gast_no, task_no in hist.index:
        stats[gast_no , task_no] = hist[gast_no, task_no]
    return stats

def get_instance(task_counts, pejl_b=None, sick=[], hu=[], assigned={}, n_shifts=6, pejl_shift=2, kabys_shifts=[0,1,2], team_order=[0,1,2]):
    """
    TODO: handle vagthavende samme morgen og aften
    TODO: håndter allerede udfyldte vagter
    """
    n_gasts, n_tasks = task_counts.shape
    
    # x_ijk, gast i, task j, shift k
    X = P.LpVariable.dicts('x', (range(n_gasts), range(n_tasks), range(n_shifts)), 0, 1, P.LpBinary)

    prob = P.LpProblem('Schedule', P.LpMinimize)
    
    # objective function
    prob += P.lpSum([
        task_counts[i][j] * X[i][j][k] 
        for i in range(n_gasts) 
        for j in range(n_tasks) 
        for k in range(n_shifts)
    ])
    
    # same gast is vagthavende morning-evening constraint
    j_vagt = Task.VAGTHAVENDE_ELEV.value
    # TODO:
    
    # pre-assigned constraints
    for k,value in assigned.items():
        for i,task in value.items():
            j = task.value
            prob += X[i][j][k] == 1
    
        
    # pejlegast constraints
    j_a = Task.PEJLEGAST_A.value
    j_b = Task.PEJLEGAST_B.value
    for k in range(n_shifts):
        if k == pejl_shift:
            if pejl_b is not None:
                prob += X[pejl_b, j_b, k] == 1
            else:
                prob += P.lpSum([X[i][j_b][k] for i in range(n_gasts)]) == 1
            prob += P.lpSum([X[i][j_a][k] for i in range(n_gasts)]) == 1
        else:
            prob += P.lpSum([X[i][j_a][k] for i in range(n_gasts)]) == 0
            prob += P.lpSum([X[i][j_b][k] for i in range(n_gasts)]) == 0        
    
    # kabys constraint
    j = Task.DÆKSELEV_I_KABYS.value
    for k in range(n_shifts):
        if k in kabys_shifts:
            prob += P.lpSum([X[i][j][k] for i in range(n_gasts)]) == 1        
        else:
            prob += P.lpSum([X[i][j][k] for i in range(n_gasts)]) == 0
                
    # 0 or 1 task per gast, depending on shift constraint
    for k in range(n_shifts):
        active_team = team_order[k % 3]
        min_gast, max_gast = team_minmax(active_team)
        for i in range(n_gasts):
            i_works = int(min_gast <= i < max_gast)
            prob += P.lpSum([X[i][j][k] for j in range(n_tasks)]) <= i_works
    
    # exactly 1 gast per task per shift, but ignore vagthavende, pejlegast and kabys
    ignored = [
        Task.VAGTHAVENDE_ELEV.value,
        Task.PEJLEGAST_A.value, 
        Task.PEJLEGAST_B.value, 
        Task.DÆKSELEV_I_KABYS.value, 
    ]
    other_tasks = [j for j in range(n_tasks) if j not in ignored]
    for k in range(n_shifts):        
        for j in other_tasks:
            #print(f'[DEBUG] shift {k}, task {j}')
            prob += P.lpSum([
                X[i][j][k] 
                for i in range(n_gasts)
            ]) == 1
    # no tasks for left-out gasts (i.e. sick and hu)
    for i in sick + hu:
        prob += P.lpSum([
            X[i][j][k] 
            for j in range(n_tasks)
            for k in range(n_shifts)
        ]) == 0

    return prob, X
        

## Example

In [150]:
# simulate som sick gasts
TIDSPUNKTER = ['08 - 12', '12 - 16', '16 - 20', '20 - 24', '24 - 04', '04 - 08']

task_counts = get_task_counts(df)

n_gasts, n_tasks = task_counts.shape
n_shifts = 6

sick = [0,1,2]
hu = [4,5,8]
assigned = {0: {6: Task.ORDONNANS, 3: Task.BJÆRGEMÆRS}}

prob, X = get_instance(task_counts, sick=sick, hu=hu, assigned=assigned)
#prob, X = get_instance(task_counts)

status = prob.solve()
print(f'Optimal? {"yes" if status == 1 else "no"}')
print(f'Infeasible? {"yes" if status == -1 else "no"}')
print()

for k in range(n_shifts):
    print(f'Vagt {TIDSPUNKTER[k]}')
    for j in range(len(Task)):
        for i in range(n_gasts):
            x = X[i][j][k]
            if x.varValue == 1:
                task_name = Task(j)
                count = task_counts[i][j]
                print(f'- Gast {i} er {task_name} ({count} før)')



Optimal? yes
Infeasible? no

Vagt 08 - 12
- Gast 6 er Task.ORDONNANS (2 før)
- Gast 17 er Task.UDKIG (0 før)
- Gast 3 er Task.BJÆRGEMÆRS (3 før)
- Gast 18 er Task.RORGÆNGER (0 før)
- Gast 7 er Task.UDSÆTNINGSGAST_A (0 før)
- Gast 16 er Task.UDSÆTNINGSGAST_B (0 før)
- Gast 9 er Task.UDSÆTNINGSGAST_C (0 før)
- Gast 19 er Task.UDSÆTNINGSGAST_D (0 før)
- Gast 15 er Task.DÆKSELEV_I_KABYS (0 før)
Vagt 12 - 16
- Gast 30 er Task.ORDONNANS (0 før)
- Gast 25 er Task.UDKIG (0 før)
- Gast 24 er Task.BJÆRGEMÆRS (0 før)
- Gast 20 er Task.RORGÆNGER (0 før)
- Gast 27 er Task.UDSÆTNINGSGAST_A (0 før)
- Gast 36 er Task.UDSÆTNINGSGAST_B (0 før)
- Gast 37 er Task.UDSÆTNINGSGAST_C (0 før)
- Gast 38 er Task.UDSÆTNINGSGAST_D (0 før)
- Gast 22 er Task.DÆKSELEV_I_KABYS (0 før)
Vagt 16 - 20
- Gast 46 er Task.ORDONNANS (0 før)
- Gast 51 er Task.UDKIG (0 før)
- Gast 56 er Task.BJÆRGEMÆRS (0 før)
- Gast 50 er Task.RORGÆNGER (0 før)
- Gast 47 er Task.UDSÆTNINGSGAST_A (0 før)
- Gast 49 er Task.UDSÆTNINGSGAST_B (0 fø