In [1]:
import pandas as pd
import numpy as np
import random
import math

In [2]:
schedule = pd.read_csv('./data/clean_timetable.csv')
rooms = pd.read_csv('./data/clean_rooms.csv')

In [3]:
print("There's %i type of classes" %(len(schedule['Unidade de execução'].unique())))
print("There's %i available rooms" % (rooms.shape[0]))

There's 759 type of classes
There's 120 available rooms


In [4]:
df_count_class = schedule[['Unidade de execução', 'Turma', 'Turno']].groupby(['Unidade de execução','Turma', 'Turno'], dropna=False)['Unidade de execução'] \
                             .count() \
                             .reset_index(name='count') \
                             .sort_values(['count'], ascending=False)

In [13]:
df_count_class

Unnamed: 0,Unidade de execução,Turma,Turno,count
84,Arquitectura V,"ARC6, ARC5",L6095PL03,72
83,Arquitectura V,"ARC4, ARC3",L6095PL02,72
78,Arquitectura I,ARA1,L2205PL01,72
79,Arquitectura I,ARA2,L2205PL02,72
80,Arquitectura III,ARB1,L2245PL01,72
...,...,...,...,...
1469,Treino de Competências Académicas em Psicologia,"LISPA1, DPA1",00217S02,1
1306,Seminário de Projecto em Finanças,MFB1,02036S01,1
1310,Seminário de Projecto em Psicologia,"LISPA1, DPA1",01836S02,1
296,Dissertação em Informática e Gestão,MIGB1,02672S01,1


In [5]:
df_mean_class = schedule[['Unidade de execução', 'Inscritos no turno (no 1º semestre é baseado em estimativas)', 'Turma']].groupby(['Unidade de execução', 'Turma'], dropna=False)['Inscritos no turno (no 1º semestre é baseado em estimativas)'] \
                             .mean().round(0) \
                             .reset_index(name='mean')

In [14]:
df_mean_class

Unnamed: 0,Unidade de execução,Turma,mean
0,A Europa e o Mundo Entre as Guerras,HMCC1,36.0
1,A Europa e o Mundo no Século XIX,"CI-IEPM2, CI-IEPM1",5.0
2,A Europa e o Mundo no Século XIX,HMCB1,25.0
3,A Investigação Sociológica em Portugal,DSA1,9.0
4,Abordagens à Psicopatologia,"SS-PL-C2, SS-PL-C1",47.0
...,...,...,...
1371,Ética e Deontologia Profissional,C,21.0
1372,Ética e Deontologia Profissional,D,22.0
1373,Ética e Desenvolvimento Profissional,"MPCPMB1, MPCPCJRA1",13.0
1374,"Ética, Responsabilidade e Sustentabilidade Emp...",MGEA1,28.0


In [6]:
def get_rooms(class_capacity_level):
    capacity_to_filter = class_capacity_level - 5
    rooms_filtered = rooms[(rooms['Capacidade Normal'] >= capacity_to_filter)].sort_values(by=['Capacidade Normal'], ascending=True)
    return rooms_filtered['Code'].reset_index(drop=True)

In [7]:
def choose_best_room_oficial(rooms_timetable, array_rooms, class_init, name_class, c_class, turn_class):
    available_rooms = []
    solution = pd.DataFrame(columns=["Time", "Room Code"])
    n_classes = len(class_init)
    times_assign = class_init['Início'].values.tolist()
    aux_counter = 1
    for index in range(len(array_rooms)):
        room = array_rooms[index]
        timetable = rooms_timetable[room]
        intersection_time = np.intersect1d(timetable, times_assign, assume_unique=False, return_indices=False).tolist()
        if len(intersection_time) == 0:
            data = []
            for time in times_assign:
                data.append((time, room))
            aux_df = pd.DataFrame(data=data, columns=["Time", "Room Code"])
            solution = solution.append(aux_df, ignore_index=True)
            n_classes = n_classes - len(times_assign)
            if n_classes == 0:
                break
        elif len(intersection_time) != len(timetable): # Didn't intersect any time --> so is empty
            available_times = np.setdiff1d(times_assign, intersection_time, assume_unique=False).tolist()
            data = []
            for time in available_times:
                data.append((time, room))
            aux_df = pd.DataFrame(data=data, columns=["Time", "Room Code"])
            solution = solution.append(aux_df, ignore_index=True)
            n_classes = len(intersection_time)
            times_assign = intersection_time
            if n_classes == 0:
                times_assign = []
                break
        aux_counter +=1
    #Verify if still has classes that has no assigned room
    final_solution = class_init.merge(solution, how="inner", left_on="Início", right_on="Time")[['Code', 'Início' ,"Room Code"]]
    return final_solution

In [8]:
def update_timetable(df_solution, timetable): #selected_room variable--> input
    timetable_c = timetable.copy()
    list_rooms = df_solution['Room Code'].unique()
    for room_code in list_rooms:
        timetable_c[room_code] = timetable_c[room_code] + df_solution[df_solution['Room Code'] == room_code]['Início'].values.tolist()
    return timetable_c

In [11]:
def merge_solution(df_schedule, df_solution, df_rooms):
    df_sol_smp = df_solution.merge(df_rooms, how="inner", left_on="Room Code", right_on="Code")[['Code_x', 'Nome sala', 'Capacidade Normal']].rename(columns={"Code_x": "Class Code"})
    interesting_columns = df_schedule.columns.tolist() + ["Nome sala", "Capacidade Normal", "Lotação_Default"]
    interesting_columns.remove("Code")
    interesting_columns.remove("Sala da aula")
    interesting_columns.remove("Lotação")
    df_join = df_schedule.merge(df_sol_smp, how="inner", left_on="Code", right_on="Class Code").rename(columns={"Lotação": "Lotação_Default"})
    df_final = df_join[interesting_columns].rename(columns={"Nome sala": "Sala da aula", "Capacidade Normal": "Lotação"}).to_csv("./output/final_schedule2.csv", index=False, encoding="utf-8-sig")

In [9]:
rooms_timetable = [[]] * len(rooms)
df_solution = pd.DataFrame(columns=["Code", 'Início' ,"Room Code"])
counter = 0
for row in df_count_class.values:
    name_class = row[0]
    c_class = row[1]
    turn_class = row[2]
    class_timetable = schedule[(schedule['Unidade de execução'] == name_class) & (schedule['Turma'] == c_class) & (schedule['Turno'] == turn_class)][['Code', 'Início']] if isinstance(c_class, str) else schedule[(schedule['Unidade de execução'] == name_class) & (schedule['Turma'].isnull()) & (schedule['Turno'] == turn_class)][['Code', 'Início']]
    n_students = int(df_mean_class[(df_mean_class['Unidade de execução'] == name_class) & (df_mean_class['Turma'] == c_class)]['mean']) if isinstance(c_class, str) else int(df_mean_class[(df_mean_class['Unidade de execução'] == name_class) & (df_mean_class['Turma'].isnull())]['mean'])
    # Get list of rooms that can handle the n_students
    list_rooms = get_rooms(n_students)
    # Select the first room of the list
    selected_room = choose_best_room_oficial(rooms_timetable, list_rooms, class_timetable, name_class, c_class, turn_class)
    # Assign selected room for that class
    df_solution = df_solution.append(selected_room)
    rooms_timetable = update_timetable(selected_room, rooms_timetable)
    counter +=1
df_solution = df_solution.drop_duplicates()

In [10]:
print('Solution length: %i ' % (len(df_solution)))
print('Needed length: %i ' % (len(schedule)))
print('Number duplicated code: %i' % (len(df_solution) - len(df_solution['Code'].unique())))

Solution length: 23957 
Needed length: 23957 
Number duplicated code: 0


In [12]:
merge_solution(schedule, df_solution, rooms)