# Data Files Generation

In [None]:
%load_ext autoreload
%autoreload 2

from pathlib import Path 

import pandas as pd
from sklearn.preprocessing import MultiLabelBinarizer

from schedulebot.utils.date_generation import get_date_string


CURRENT_DPATH = Path("__file__").parent.resolve()
PROJECT_DPATH = CURRENT_DPATH.parent

DATA_DPATH = PROJECT_DPATH / "data" 
DATA_DPATH.mkdir(parents=True, exist_ok=True)

CACHE_DPATH = DATA_DPATH / get_date_string() 
CACHE_DPATH.mkdir(parents=True, exist_ok=True)

## Teachers Info

In [None]:
# TODO: add department name to each teacher 
TEACHERS = [
  ["Дикун", "Ирина", "Александровна", "professor", 2.0],
  ["Козлова", "Людмила", "Петровна", "professor", 5.0],
  ["Королев", "Виталий", "Вячеславович", "professor", 4.0], 
  ["Кузнецов", "Владимир", "Евгеньевич",  "professor", 5.0],
  ["Якупов", "Олег", "Эльдусович", "assistant", 4.0],
  ["Буканин", "Владимир", "Анатольевич", "professor", 2.0],
  ["Демидович", "Ольга", "Васильевна", "professor", 1.0], 
  ["Овдиенко", "Евгений", "Николаевич", "assistant", 1.0],
  ["Трусов", "Александр", "Александрович", "assistant", 2.0],
  ["Трусов", "Александр", "Олегович", "professor", 2.0],
  ["Леута", "Алексей", "Александрович", "professor", 2.0],
  ["Мирошников", "Александр", "Николаевич", "professor", 2.0],
  ["Амбросовская", "Елена", "Борисовна", "professor", 5.0], 
  ["Лукичев", "Андрей", "Николаевич", "professor", 2.0],
  ["Михайлов", "Данил", "Павлович", "assistant", 2.0],
  ["Копычев", "Михаил", "Михайлович", "professor", 1.5],
  ["Игнатович", "Юлия", "Васильевна", "assistant", 1.5],
  ["Скороходов", "Дмитрий", "Алексеевич", "professor", 2.0],
  ["Вейнмейстер", "Андрей", "Викторович", "professor", 2.0], 
  ["Филатова", "Екатерина", "Сергеевна", "professor", 1.5],
  ["Богданова", "Светлана", "Михайловна", "assistant", 1.5],
  ["Федоркова", "Анастасия", "Олеговна", "assistant", 2.0],
  ["Гречухин", "Михаил", "Николаевич", "professor", 0.5],
  ["Маловский", "Андрей", "Иванович", "assistant", 1]
]

teachers_df = pd.DataFrame(
    TEACHERS, columns=["last_name", "first_name", "middle_name", "qualification", "weekly_hours"]
)
teachers_df.head()

In [None]:
_SAVE = True 

if _SAVE: 
    save_fpath = CACHE_DPATH / "teachers.csv"
    teachers_df.to_csv(save_fpath)

## Subjects Info

In [None]:
SUBJECTS = [
  ["Привод", "practice", 2.0, [9491, 9492, 9493, 9494], ["Дикун Ирина Александровна professor"]],
  ["Привод", "lecture", 1.0, [9491, 9492, 9493, 9494], ["Козлова Людмила Петровна professor"]],
  ["Привод", "lab", 4.0, [9491, 9492, 9493, 9494], ["Козлова Людмила Петровна professor", "Королев Виталий Вячеславович professor"]],
  ["ТССУ", "lecture", 1.0, [9491, 9492, 9493, 9494], ["Кузнецов Владимир Евгеньевич professor"]],
  ["ТССУ", "practice", 2.0, [9491, 9492, 9493, 9494], ["Кузнецов Владимир Евгеньевич professor"]],
  ["ТССУ", "practice", 2.0, [9491, 9492, 9493, 9494], ["Кузнецов Владимир Евгеньевич professor"]],
  ["ТССУ", "lab", 4.0, [9491, 9492, 9493, 9494], ["Якупов Олег Эльдусович assistant"]],
  ["БЖД", "lecture", 1.0, [9491, 9492, 9493, 9494], ["Буканин Владимир Анатольевич professor"]],
  ["БЖД", "practice", 4.0, [9491, 9492, 9493, 9494], [
        "Буканин Владимир Анатольевич professor",
        "Демидович Ольга Васильевна professor",
        "Трусов Александр Олегович professor"
      ]
  ],
  ["БЖД", "lab", 4.0, [9491, 9492, 9493, 9494], [
        "Овдиенко Евгений Николаевич assistant",
        "Трусов Александр Александрович assistant",
        "Маловский Андрей Иванович assistant"
      ]
  ],
  ["АПМСЭЭС", "lacture", 1.0, [9493], ["Леута Алексей Александрович professor"]],
  ["АПМСЭЭС", "lab", 1.0, [9493], ["Леута Алексей Александрович professor"]],
  ["МССУ (ДВС6)", "lecture", 1.0, [9494], ["Мирошников Александр Николаевич professor"]],
  ["МССУ (ДВС6)", "lab", 0.5, [9494], ["Мирошников Александр Николаевич professor"]],
  ["МССУ (ДВС6)", "practice", 0.5, [9494], ["Мирошников Александр Николаевич professor"]],
  ["ТОУ", "lecture", 1.0, [9491, 9492, 9493, 9494], ["Амбросовская Елена Борисовна professor"]],
  ["ТОУ", "lab", 4.0, [9491, 9492, 9493, 9494], ["Амбросовская Елена Борисовна professor"]],
  ["СЭЭС", "lecture", 1.0, [9493], ["Лукичев Андрей Николаевич professor"]],
  ["СЭЭС", "practice", 0.5, [9493], ["Лукичев Андрей Николаевич professor"]],
  ["СЭЭС", "lab", 0.5, [9493], ["Михайлов Данил Павлович assistant"]],
  ["МПТвМиРТ", "lecture", 1.0, [9491, 9492], ["Михайлов Данил Павлович assistant"]],
  ["МПТвМиРТ", "lab", 1.0, [9491, 9492], ["Михайлов Данил Павлович assistant"]],
  ["МПТвМиРТ", "practice", 1.0, [9491, 9492], ["Михайлов Данил Павлович assistant"]],
  ["ФиРИСУК (ДВС8)", "lecture", 1.0, [9494], ["Копычев Михаил Михайлович professor"]],
  ["ФиРИСУК (ДВС8)", "practice", 0.5, [9494], ["Копычев Михаил Михайлович professor", "Игнатович Юлия Васильевна assistant"]],
  ["ФиРИСУК (ДВС8)", "lab", 0.5, [9494], ["Игнатович Юлия Васильевна assistant"]],
  ["СУЭЭУК", "practice", 0.5, [9494], ["Скороходов Дмитрий Алексеевич professor"]],
  ["СУЭЭУК", "lab", 0.5, [9494], ["Скороходов Дмитрий Алексеевич professor"]],
  ["СУЭЭУК", "lecture", 1.0, [9494], ["Скороходов Дмитрий Алексеевич professor"]],
  ["ПЛКиПС", "lecture", 1.0, [9491,9492,9494], ["Вейнмейстер Андрей Викторович professor"]],
  ["ПЛКиПС", "lab", 1.5, [9491, 9492, 9494], ["Вейнмейстер Андрей Викторович professor", "Филатова Екатерина Сергеевна professor"]],
  ["ПЛКиПС", "practice", 1.5, [9491, 9492, 9494], ["Филатова Екатерина Сергеевна professor", "Богданова Светлана Михайловна assistant"]],
  ["ТЕХНИЧЕСКОЕ ЗРЕНИЕ", "lecture", 1.0, [9491, 9492], ["Гречухин Михаил Николаевич professor"]],
  ["ТЕХНИЧЕСКОЕ ЗРЕНИЕ", "lab", 1.0, [9491, 9492], ["Федоркова Анастасия Олеговна assistant"]],
  ["ТЕХНИЧЕСКОЕ ЗРЕНИЕ", "practice", 1.0, [9491, 9492], ["Федоркова Анастасия Олеговна assistant"]]
]

subjects_df = pd.DataFrame(
    SUBJECTS, columns=["subject_name", "subject_type", "weekly_hours", "groups", "teachers"]
)
subjects_df.head()

### One-Hot-Encoding

In [None]:
# NOTE: list of groups binarization 
mlb_binarizer = MultiLabelBinarizer(sparse_output=False)

binarized_groups = pd.DataFrame(
    mlb_binarizer.fit_transform(subjects_df["groups"]), columns=mlb_binarizer.classes_
)

subjects_df = pd.concat((subjects_df, binarized_groups), axis=1)


In [None]:
# NOTE: list of groups binarization 
mlb_binarizer = MultiLabelBinarizer(sparse_output=False)

binarized_teachers = pd.DataFrame(
    mlb_binarizer.fit_transform(subjects_df["teachers"]), columns=mlb_binarizer.classes_
)

subjects_df = pd.concat((subjects_df, binarized_teachers), axis=1)


In [None]:
_SAVE = True 

if _SAVE: 
    save_fpath = CACHE_DPATH / "subjects.csv"
    subjects_df.to_csv(save_fpath)

## Rooms Info

In [None]:
ROOM_INFO = {
    "room": [
        "4302",
        "1229",
        "D103",
        "5230",
        "2403",
        "2404",
        "8103-1",
        "5143",
        "5141",
        "5135",
        "5134",
        "5221",
        "8101",
        "8112",
        "8217",
        "2322",
        "8102",
        "1158",
        "8204",
        "8203-2",
        "8203-1"
    ],
    "type":[
        "practice",
        "lecture",
        "lab",
        "lecture",
        "practice",
        "practice",
        "lab",
        "lecture",
        "practice",
        "lab",
        "practice",
        "lecture",
        "lab",
        "mixed",
        "lab",
        "lecture",
        "mixed",
        "lecture",
        "mixed",
        "practice",
        "mixed"]
}

room_df = pd.DataFrame.from_dict(ROOM_INFO)
room_df.head()

In [None]:
_SAVE = True 

if _SAVE: 
    save_fpath = CACHE_DPATH / "rooms.csv"
    room_df.to_csv(save_fpath)