In [1]:
import pandas as pd
from TimetableBot.settings import BASE_DIR
import os
from fuzzywuzzy import process
import re
from typing import Tuple, Dict
import datetime

In [153]:
def read_timetable(path:str)->pd.DataFrame:
    skiprows = list(range(16))
    try:
        df = pd.read_excel(path, skiprows=lambda ind: ind in skiprows)
        cols = ['Unnamed: 0', 'Unnamed: 1']
        return df
    except Exception:
        return "Выбран не подходящий файл"

In [154]:
def get_cleaned_group_names(df: pd.DataFrame) -> Tuple:
    pattern = r"\d\d-\d\d\d"
    result = []
    for col in df.columns:
        if res := re.search(pattern, group):
            re
    return tuple([col for col in df.columns if "Unnamed" not in col])

In [155]:
def get_only_group_numbers(df: pd.DataFrame, cleaned_group_names: Tuple|None = None) -> Tuple:
    if cleaned_group_names is None:
        cleaned_group_names = get_cleaned_group_names(df=df)
    pattern = r"\d\d-\d\d\d"
    return tuple([re.search(pattern, group).group() for group in cleaned_group_names])

def get_groups_dict_by_group_numbers(df: pd.DataFrame, cleaned_group_names: Tuple|None = None) -> Dict:
    if cleaned_group_names is None:
        cleaned_group_names = get_cleaned_group_names(df=df)
    pattern = r"\d\d-\d\d\d"
    group_dict = {}
    for group in cleaned_group_names:
        g_data = re.search(pattern, group)
        group_num, group_full_name = g_data.group(), g_data.string 
        if group_dict.get(group_num):
            group_dict[group_num].append(group_full_name)
            continue
        group_dict.update({
            group_num:[group_full_name]
        })
    return group_dict

In [156]:
def group_num_validator(user_input: str) -> bool:
    pattern = r"\d\d-\d\d\d"
    return True if re.search(pattern, user_input) else False
    
def get_group_num(user_input: str) -> bool:
    pattern = r"\d\d-\d\d\d"
    return re.search(pattern, user_input).group()
# print(group_num_validator("qweqweqwe"))
# print(group_num_validator("'09-301': ['09-302 (1)', '09-303 (2)'],"))
# print(group_num_validator("qweq09-301weqwe"))
# print(group_num_validator("09-301"))
# print(group_num_validator(""))


In [157]:
class NotGroupNumStyle(Exception):
    def __init__(self, *args):
        if args:
            self.message = args[0]
        else:
            self.message = None

    def __str__(self):
        if self.message:
            return f'NotGroupNumStyle, {self.message} '
        else:
            return 'NotGroupNumStyle has been raised'
            
    def get_message(self):
        return self.message

class GroupNotFound(Exception):
    def __init__(self, *args):
        if args:
            self.message = args[0]
        else:
            self.message = None

    def __str__(self):
        if self.message:
            return f'GroupNotFound, {self.message} '
        else:
            return 'GroupNotFound has been raised'
            
    def get_message(self):
        return self.message

In [158]:
def get_founded_group_names(user_input:str, groups_dict: dict)-> list[str]:
    if group_num_validator(user_input):
        g_num = get_group_num(user_input)
        if result := groups_dict.get(g_num):
            return result
        raise GroupNotFound(f"Введенный номер группы - {g_num}, не найден в рассписании")
    else:
        raise NotGroupNumStyle("Введен неверный формат номера группы.\nНомер должен быть вида XX-XXX,  например 01-001")


In [159]:
path = os.path.join(BASE_DIR, "fixed.xlsx")
tt_df = read_timetable(path=path)
group_names = get_cleaned_group_names(df=tt_df)
only_numbers = get_only_group_numbers(df=tt_df, cleaned_group_names=group_names)
groups_dict = get_groups_dict_by_group_numbers(df=tt_df, cleaned_group_names=group_names)

AttributeError: 'NoneType' object has no attribute 'group'

In [160]:
tt_df

Unnamed: 0,1 курс,1 курс.1,09-301 (1),09-301 (2),09-302 (1),09-302 (2),09-303 (1),09-303 (2),09-311 (1),09-311 (2),...,09-215 (2) (Математические методы и информационные технологии в экономике и финансах),09-215 (3) (Искусственный интеллект и суперкомпьютерные вычисления),09-225 (1) (Вычислительная геометрия и высокопроизводительные вычисления.),09-225 (2) (Классические и квантовые методы обработки информаций.),09-225 (3) Методы математического моделирования.,09-235(1) (Машинное обучение и компьютерное зрение),09-235 (2) (Математические основы и программное обеспечение информационной безопасности и защиты информации.),09-245 (Инфокоммуникации в специальной робототехнике),09-275 (Информационная безопасноть экономических систем.),09-265 (Технологии разработки информационных систем)
0,понедельник,8.30-10.00,(2-10 неделя) Иностранный язык. Закирова Р.Р. ...,(2-10 неделя) Иностранный язык. Закирова Р.Р. ...,(2-10 неделя) Иностранный язык. Закирова Р.Р. ...,(2-10 неделя) Иностранный язык. Закирова Р.Р. ...,(2-10 неделя) Иностранный язык. Закирова Р.Р. ...,(2-10 неделя) Иностранный язык. Закирова Р.Р. ...,(04.09.23-25.12.23) Математический анализ. Си...,(04.09.23-25.12.23) Математический анализ. Си...,...,,,,,,,,,,
1,понедельник,8.30-10.00,(27.11.23 и 4.12.23) Алгебра и геометрия. Шуль...,(27.11.23 и 4.12.23) Алгебра и геометрия. Шуль...,(27.11.23 и 4.12.23) Алгебра и геометрия. Шуль...,(27.11.23 и 4.12.23) Алгебра и геометрия. Шуль...,(27.11.23 и 4.12.23) Алгебра и геометрия. Шуль...,(27.11.23 и 4.12.23) Алгебра и геометрия. Шуль...,(04.09.23-25.12.23) Математический анализ. Си...,(04.09.23-25.12.23) Математический анализ. Си...,...,,,,,,,,,,
2,понедельник,10.10-11.40,н/н (11.09.23-18.12.23) Психология. Устин П.Н....,н/н (11.09.23-18.12.23) Психология. Устин П.Н....,н/н (11.09.23-18.12.23) Алгебра и геометрия. Ш...,н/н (11.09.23-18.12.23) Алгебра и геометрия. Ш...,(04.09.23-25.12.23) Математический анализ. Че...,(04.09.23-25.12.23) Математический анализ. Че...,(04.09.23-25.12.23) Математический анализ. С...,(04.09.23-25.12.23) Математический анализ. С...,...,,,,,,,,,,
3,понедельник,10.10-11.40,ч/н (04.09.23-25.12.23) Алгебра и геометрия. Ш...,ч/н (04.09.23-25.12.23) Алгебра и геометрия. Ш...,ч/н (04.09.23-25.12.23) Психология. Устин П.Н....,ч/н (04.09.23-25.12.23) Психология. Устин П.Н....,(04.09.23-25.12.23) Математический анализ. Че...,(04.09.23-25.12.23) Математический анализ. Че...,(04.09.23-25.12.23) Математический анализ. С...,(04.09.23-25.12.23) Математический анализ. С...,...,,,,,,,,,,
4,понедельник,12.10-13.40,н/н (11.09.23-18.12.23) Психология. Шмелева С...,н/н (11.09.23-18.12.23) Психология. Шмелева С...,н/н (11.09.23-18.12.23) Психология. Шмелева С...,н/н (11.09.23-18.12.23) Психология. Шмелева С...,н/н (11.09.23-18.12.23) Психология. Шмелева С...,н/н (11.09.23-18.12.23) Психология. Шмелева С...,(04.09.23-25.12.23) Алгебра и геометрия. Стехи...,(04.09.23-25.12.23) Алгебра и геометрия. Стехи...,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
94,,,,,,,,,,,...,,,,,,,,,,
95,,,,,,,,,,,...,,,,,,,,,,
96,,,,,,,,,,,...,,,,,,,,,,
97,,,,,,,,,,,...,,,,,,,,,,


In [152]:
def check_merged(df: pd.DataFrame):
    merged_cells = df._reader.ws.merged_cells
    for merged_cell in merged_cells:
        start_row, end_row, start_col, end_col = merged_cell
        print(f"Merged cell found from {start_row}:{start_col} to {end_row}:{end_col}")

check_merged(df=tt_df)

AttributeError: 'DataFrame' object has no attribute '_reader'

In [132]:
# этот блок и те что ниже - юзлесс 

user_inputs = ["qweqweqwe", "'09-301': ['09-302 (1)', '09-303 (2)'],","qweq09-301weqwe","09-301","", "09-315"]
for u_input in user_inputs:
    try:
        group_names = get_founded_group_names(user_input=u_input, groups_dict=groups_dict)
        print(group_names)
    except (GroupNotFound, NotGroupNumStyle) as e:
        print(e.get_message())

Введен неверный формат номера группы.
Номер должен быть вида XX-XXX,  например 01-001
['09-301 (1)', '09-301 (2)']
['09-301 (1)', '09-301 (2)']
['09-301 (1)', '09-301 (2)']
Введен неверный формат номера группы.
Номер должен быть вида XX-XXX,  например 01-001
['09-315 (1) (Анализ данных и его приложения)', '09-315 (2) (Математическое моделирование физических процессов) ', '09-315 (3) (Математические методы и информационные технологии в экономике и финансах)', '09-315 (4) (Искусственный интеллект и суперкомпьютерные вычисления)']


In [133]:
def get_today_weekday():
    date = datetime.datetime.today()
    weekday_number = date.weekday()
    weekday_names = ['понедельник', 'вторник', 'среда', 'четверг', 'пятница', 'суббота', "воскресенье"]
    weekday_name = weekday_names[weekday_number]
    return weekday_name

In [138]:
def get_weekday_rows(df:pd.DataFrame)->Dict[str, list]:
    df = tt_df[['Unnamed: 0', 'Unnamed: 1']]
    day_dict:[str, list] = {}
    for row in df.itertuples():
        index, day = row[:2]
        if len(day)==2:
            continue
        if day_dict.get(day):
            day_dict[day].append(index)
        else:
            day_dict.update({
                day: [index]
            })
        if row[0] == 89:
            break
    return day_dict

def get_timetable_text_by_group_and_day(df:pd.DataFrame, selected_group:str, selected_weekday:str, is_odd:bool = True)->Dict[str, list]:
    weekday_rows = get_weekday_rows(df=df)
    df = tt_df[['Unnamed: 0', 'Unnamed: 1', selected_group]]
    
    for row in df.itertuples():
        index, day, time, subj = row
        if index not in weekday_rows[selected_weekday] :
            continue
        print(time, subj)
        continue
        if subj:
            subj = subj.strip()
            data = [time, subj, get_dates_from_to(subj)]
            if is_odd and is_odd_subj(subj=subj.strip()):
                print(*data)
            elif not is_odd and is_even_subj(subj=subj.strip()):
                print(*data)
        if row[0] == 89:
            break

def is_odd_subj(subj: str)-> bool:
    return "ч/н" not in subj 

def is_even_subj(subj: str)-> bool:
    return "н/н" not in subj 

def get_dates_from_to(subj:str)->str:
    pattern = r"\d{2}\.\d{2}.\d{2}-\d{2}\.\d{2}.\d{2}"
    second_pattern = r"\(\d+-\d+.{1,10}\)"
    res = re.search(pattern, subj)
    if res:
        return res.group()
    elif res := re.search(second_pattern, subj):
        return res.group()
    return "-"

In [144]:
selected_group = '09-302 (1)'
selected_weekday = "понедельник"#get_today_weekday()
get_timetable_text_by_group_and_day(df=tt_df, selected_group=selected_group, selected_weekday=selected_weekday)

 8.30-10.00 nan
 8.30-10.00 nan
10.10-11.40 н/н (11.09.23-18.12.23) Алгебра и геометрия. Шульгина О.Н. ауд. 1113 (Кремл.35)
10.10-11.40 ч/н (04.09.23-25.12.23) Психология. Устин П.Н. ауд.  907 (Кремл.35)
12.10-13.40 nan
12.10-13.40 nan
13.50-15.20 nan
13.50-15.20 nan
15.50-17.20 nan
15.50-17.20 nan
17.30-19.00 nan
17.30-19.00 nan
19.10-20.40 nan
19.10-20.40 nan


In [141]:
groups_dict

{'09-301': ['09-301 (1)', '09-301 (2)'],
 '09-302': ['09-302 (1)', '09-302 (2)'],
 '09-303': ['09-303 (1)', '09-303 (2)'],
 '09-311': ['09-311 (1)', '09-311 (2)'],
 '09-312': ['09-312 (1)', '09-312 (2)'],
 '09-313': ['09-313 (1)', '09-313 (2)'],
 '09-314': ['09-314 (1)', '09-314 (2)'],
 '09-321': ['09-321 (1)', '09-321 (2)'],
 '09-322': ['09-322 (1)', '09-322 (2)'],
 '09-331': ['09-331 (1)', '09-331 (2)'],
 '09-332': ['09-332 (1)', '09-332 (2)'],
 '09-341': ['09-341 (1)', '09-341 (2)'],
 '09-342': ['09-342 (1)', '09-342 (2)'],
 '09-343': ['09-343 (1)', '09-343 (2)'],
 '09-351': ['09-351 (1)', '09-351 (2)'],
 '09-352': ['09-352 (1)', '09-352 (2)'],
 '09-353': ['09-353 (1)', '09-353 (2)'],
 '09-361': ['09-361 (1)', '09-361 (2)'],
 '09-362': ['09-362 (1)', '09-362 (2)'],
 '09-363': ['09-363 (1)', '09-363 (2)'],
 '09-201': ['09-201 (1)', '09-201 (2)'],
 '09-202': ['09-202 (1)', '09-202 (2)'],
 '09-203': ['09-203 (1)', '09-203 (2)'],
 '09-211': ['09-211 (1)', '09-211 (2)'],
 '09-212': ['09-

In [21]:

print(day_dict)

{'понедельник': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13], 'вторник': [15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28], 'среда': [30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43], 'четверг': [45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59], 'пятница': [61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74], 'суббота': [76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89]}


In [111]:

print(day_dict.keys())

dict_keys(['понедельник', 'вторник', 'среда', 'четверг', 'пятница', 'суббота'])
