# day01 - Трудно жить без даты!

---

Импортируем библиотеки с которыми мы уже встречались, и которые нам понадобятся в дальнейшем:

In [3]:
import pandas as pd
import numpy as np
import math
from datetime import datetime, timedelta, date, time

---

## Неоднозначное соответствие единиц измерения времени

В этом разделе представлены величины, имеющие несколько значений. Именно эти величины чаще всего используются в повседневной жизни, поэтому необходимо научиться их рассчитывать.

- месяц - примерно 30 суток (от 28 до 31):
    - январь, март, май, июль, август, октябрь и декабрь - 31 день
    - апрель, июнь, сентябрь, ноябрь - 30 дней
    - февраль - 28 или 29 дней
- в году от 52 до 54 недель в зависимости от способа счисления, которые различаются, например, в США и Канаде от Европы
- согласно ISO 8601, первой неделей года считается неделя, содержащая первый четверг года
    - если 1 января или 31 декабря выпадает на четверг (или 1 января выпадает на среду в високосный год), то год содержит 53 недели
    - в остальных случаях год содержит 52 недели
- год содержит 365 или 366 дней
- Високосный год определяется согласно следующим правилам:
    - если год без остатка делится на 400, то это високосный год
    - если год без остатка делится на 4 и при делении на 100 имеет остаток, то это високосный год
    - в остальных случаях год не является високосным

---

Научимся определять високосный год. Напишем для этого функцию, которая будет возвращать True, если год високосный и False, в противном случае:

In [2]:
def day366(year):
    return (year % 4 == 0) and (year % 100 != 0) or (year % 400 == 0)

---

Проверим, как работает наша функция на тестовых данных 2000, 2019, 2020, 2021 и 2100 годов:

In [None]:
years = [1900, 2000, 2019, 2020, 2021, 2100]
for j in years:
    print(j, day366(j))

1900 False
2000 True
2019 False
2020 True
2021 False
2100 False


---

# Задание 1

Поздравить знакомого с Днем Рождения коротким сообщением для большинства из нас не составляет труда. С другой стороны проявленный акт внимания создает хорошее настроение и сохраняет социальные связи. Напишите код, который определяет дату рождения в игровой форме.  
Пример:
Один человек выясняет у другого дату рождения:
   - У тебя День рождения в июне?
   - Раньше.
   - В апреле?
   - Да.
   - 15-го числа?
   - Позже.
   - 20-го?
   - Да.
   - У тебя День Рождения 20 апреля
   
Механизм взаимодействия:
1. Функция get_month() формирует запросы к функции month_of_birth(month)
2. Функция month_of_birth(month, m_o_b = number_of_month) проверяет month == m_o_b:
  - Если равны, то функция возвращает значение 'да'
  - Если month > m_o_b, то значение 'раньше'
  - Если month < m_o_b, то значение 'позже'
3. Как только получено значение 'да', get_month() прекращает работу и возвращает значение полученного month, переведенного в название месяца
4. Функция get_day() формирует запросы к функции day_of_birth(day)
5. Функция day_of_birth(day, d_o_b = number_of_day) проверяет day == d_o_b:
    - Если равны, то функция возвращает значение 'да'
    - Если day > d_o_b, то значение 'раньше'
    - Если day < d_o_b, то значение 'позже'
6. Как только получено значение 'да', get_day() прекращает работу и возвращает значение полученного day
7. Публикация результата в формате "число месяц", например, 20 апреля
Вам нужно написать код так, чтобы, поменявшись функциями get, вам не пришлось редактировать код для его выполнения. Постарайтесь разработать алгоритм, чтобы общее число запросов не превышало 10.

*Рекомендация: Для того, чтобы точно были совместимы возвращаемые функциями ответы, лучше принудительно приводить строку к строчным буквам и без пробелов. Для этого используйте следующий код:*

***s = s.lower().replace(' ', '')*** *здесь s - это строка, требующая изменений*

Дополнительная информация по работе со строковыми переменными:

[Официальная документация](https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str)

[Справочник основных функций на русском языке](https://pythonworld.ru/tipy-dannyx-v-python/stroki-funkcii-i-metody-strok.html)

---

In [288]:
"""Решение задания 1"""

number_of_month = 2                # глобальная переменная месяца даты рождения, необходимо присвоение значения
number_of_day = 29                  # глобальная переменная дня даты рождения, необходимо присвоение значения
flag_month = 0
lib_months = {
    1:'Январь',
    2:'Февраль',
    3:'Март',
    4:'Апрель',
    5:'Май',
    6:'Июнь',
    7:'Июль',
    8:'Август',
    9:'Сентябрь',
    10:'Октябрь',
    11:'Ноябрь',
    12:'Декабрь',
}

day_in_month = {
    1: 31,
    2: 29,
    3: 31,
    4: 30,
    5: 31,
    6: 30,
    7: 31,
    8: 31,
    9: 30,
    10: 31,
    11: 30,
    12: 31,
}


def month_str(month, char):
    if month != 5 and month != 3:
        return lib_months[month][:len(lib_months[month]) - 1] + char
    else:
        if char != 'я':
            return lib_months[month] + char
        else:
            return lib_months[month] + 'а'

def mid(front_start, front_end):
    return (front_start + front_end) // 2

def month_of_birth(month, m_o_b = number_of_month):
    "Функция принимает значение month, сравнивает с m_o_b и возвращает результаты сравнения"
    if month > m_o_b:
        return 1
    elif month < m_o_b:
        return -1
    else:    
        return 0

    
def day_of_birth(day, d_o_b = number_of_day):
    "Функция принимает значение day, сравнивает его с d_o_b и возвращает результаты сравнения"
    if day > d_o_b:
        return 1
    elif day < d_o_b:
        return -1
    else:    
        return 0


def get_month():
    """Функция формирует запросы month и анализирует результаты сравнения, переводит номер найденного месяца в 
    строку его названия и возвращает результат"""
    global flag_month
    
    if flag_month != 0:
        return month_str(flag_month, "я")
    front_start = 1
    front_end = 12
    
    month = mid(front_start, front_end)
    print(f'У тебя день рождение в {month_str(month, "е")}?')
    
    while True:
        if month_of_birth(month) > 0:
            print('Раньше\n')
            front_end = month
            month = mid(front_start, front_end)
        elif month_of_birth(month) < 0:
            print('Позже\n')
            if front_end - front_start == 1:
                front_start = month + 1
            else:
                front_start = month
            month = mid(front_start, front_end)
        else:
            print('Да\n')
            break
        print(f'в {month_str(month, "е")}')
    flag_month = month
    return month_str(month, "я")


def get_day():
    "Функция формирует запросы day и анализирует результаты сравнения, возвращает результат"
    global flag_month
    
    if flag_month == 0:
        get_month()
    
    front_start = 1
    front_end = day_in_month[flag_month]
    
    day = mid(front_start, front_end)
    
    print(f'{day}-го числа?')
    while True:
        if day_of_birth(day) > 0:
            print('Раньше\n')
            front_end = day
            day = mid(front_start, front_end)
        elif day_of_birth(day) < 0:
            print('Позже\n')
            if front_end - front_start == 1:
                front_start = day + 1
            else:
                front_start = day
            day = mid(front_start, front_end)
        else:
            print('Да\n')
            break
        print(f'{day}-го?')
    return day
    
def birthday():                    # функция, запускающая процесс определения даты рождения и выводящая результат
    print(get_day(), get_month())
    
birthday()

У тебя день рождение в Июне?
Раньше

в Марте
Раньше

в Феврале
Да

15-го числа?
Позже

22-го?
Позже

25-го?
Позже

27-го?
Позже

28-го?
Позже

28-го?
Позже

29-го?
Да

29 Февраля


---

## Классы и методы модуля DateTime

Модуль [DateTime](https://docs.python.org/3/library/datetime.html) предназначен для управления датами и временем в Python. 

In [17]:
from datetime import datetime, timedelta, date, time

In [18]:
Time_Now = datetime.now() # возвращает текущие дату и время (год, месяц, число, час, минута, секунда, микросекунда)
Time_Now 

datetime.datetime(2022, 4, 1, 14, 34, 7, 915857)

In [19]:
datetime.date(Time_Now) # отсекает время и оставляет только дату

datetime.date(2022, 4, 1)

In [20]:
datetime.time(Time_Now) # отсекает дату, оставляя только время

datetime.time(14, 34, 7, 915857)

In [21]:
print(datetime.isoformat(Time_Now, sep='T'))                       # Дата и время с разделителем 'T'
print(datetime.isoformat(Time_Now, sep=' '))                       # Дата и время с разделителем ' '
print(datetime.isoformat(Time_Now, timespec = 'seconds', sep=' ')) # С детализацией до секунд

2022-04-01T14:34:07.915857
2022-04-01 14:34:07.915857
2022-04-01 14:34:07


In [22]:
datetime.isocalendar(Time_Now) # Возвращает в соответствии с ISO год, номер недели, номер дня недели

datetime.IsoCalendarDate(year=2022, week=13, weekday=5)

In [119]:
datetime.isoweekday(datetime.now()) # Номер дня недели (понедельник - 1)

6

In [24]:
new_year = datetime.strptime('2021-01-01 00:00:01', '%Y-%m-%d %H:%M:%S') # Распознаем из строки дату и время 
new_year                                                                 # согласно формату '%Y-%m-%d %H:%M:%S'

datetime.datetime(2021, 1, 1, 0, 0, 1)

In [25]:
new_year.strftime("%A, %d. %B %Y %H:%M") # преобразуем дату и время к строке

'Friday, 01. January 2021 00:00'

In [26]:
delta = Time_Now - new_year # Разница между датами, выраженная в днях, секундах и микросекундах
delta

datetime.timedelta(days=455, seconds=52446, microseconds=915857)

In [27]:
delta.days

455

In [28]:
delta.seconds

52446

---

# Задание 2

Требуется написать код, рассчитывающий количество рабочих часов с использованием методов модуля datetime.
Требования к коду:
1. Написать функцию *input_date()*, которая запрашивает у пользователя диапазон дат, на котором считается рабочее время. Граничные даты включаются в расчет. Функция возвращает две переменные с датами *start_date, end_date*.
2. Написать функцию *date_to_datetime(start_date, end_date)*, которая преобразует даты в формат datetime. Функция возвращает переменные *start_date, end_date*, преобразованные к формату datetime.
3. Написать функцию *delta_time(start_date, end_date)*, которая рассчитывает разницу во времени. По результату работы функции, в переменную *delta* функции, которая вызвала delta_time, должно быть записано общее количество оцениваемых дней.
4. Написать функцию *day_of_the_week(start_date)*, которая возвращает номер дня недели, соответствующий началу оцениваемого периода, в переменную *start_day_of_the_week*.
5. Написать функцию *calculating_hours(start_day_of_the_week, delta)*, которая возвращает количество рабочих часов за указанный период (и, таким образом, является точкой входа в нашу программу).
6. Сформировать тестовые данные и протестировать программу.

Упрощения:
1. Пятидневная рабочая неделя, суббота и воскресенье - выходные;
2. Каждый день отрабатывается ровно 8 часов;
3. Праздники, отгулы, отпуска и больничные отсутствуют

In [240]:
"""Решение задания 2"""
from datetime import datetime, timedelta, date, time

def input_date():
    while True:
        work_time = input('Введите две даты через дефис в формате: день-месяц-год\n'
                          'Пример: 01.01.2000-31.12.2020\n').split('-')
        if len(work_time) != 2:
            continue
        try:
            datetime.strptime(work_time[0], '%d.%M.%Y')
            datetime.strptime(work_time[1], '%d.%M.%Y')
        except ValueError:
            continue
        break
    return work_time[0], work_time[1]


def date_to_datetime(start_date, end_date):
    start_date = datetime.strptime(start_date, '%d.%m.%Y')
    end_date = datetime.strptime(end_date, '%d.%m.%Y')
    return start_date, end_date


def delta_time(start_date, end_date):
    return end_date - start_date + timedelta(days=1)


def day_of_the_week(start_date):
    start_day_of_the_week = datetime.isoweekday(start_date)
    return start_day_of_the_week


def calculating_hours(start_day_of_the_week, delta):
    if start_day_of_the_week == 7:
        cor = -1
    elif start_day_of_the_week == 6:
        cor = -2
    elif start_day_of_the_week < 6 and start_day_of_the_week + delta.days % 7 > 6:
        cor = -2
    elif start_day_of_the_week < 6 and start_day_of_the_week + delta.days % 7 == 6:
        cor = -1
    else:
        cor = 0
    
    work_hours = delta.days // 7 * 40 + (delta.days + cor) % 7 * 8
    return work_hours

In [248]:
"""Тестирование задания 2"""

start_date, end_date = date_to_datetime(*input_date())
delta = delta_time(start_date, end_date)
start_day_of_the_week = day_of_the_week(start_date)
# print(start_date)
print(f'Рабочих часов - {calculating_hours(start_day_of_the_week, delta)}')

Введите две даты через дефис в формате: день-месяц-год
Пример: 01.01.2000-31.12.2020
3.04.2022-4.4.2022
Рабочих часов - 8


---

Практически всегда в датасетах дата и время представлены строкой в формате ***год-месяц-день часы:минуты:секунды***, например:

In [None]:
Date_Time = '2021-01-02 21:15:06'
Date_Time

'2021-01-02 21:15:06'

В таком виде информация практически не может быть использована в задачах машинного обучения. Поэтому необходимо научиться преобразовывать эту строку и извлекать из нее полезную информацию. Мы уже рассмотрели библиотеку DateTime и можно пользоваться ею, но можно воспользоваться и просто обработкой строки, зная ее формат. Например, мы можем разбить строку на дату и время:

In [None]:
Date, Time = Date_Time.split()
Date, Time

('2021-01-02', '21:15:06')

Теперь мы можем разбить дату на год, месяц и день, а время - на часы, минуты и секунды:

In [None]:
Y, M, D = Date.split('-')
print(Y, M, D)
h, m, s = Time.split(':')
print(h, m, s)

2021 01 02
21 15 06


В данном способе есть недостаток - результат у нас записан в виде строк:

In [None]:
type(Y)

str

Чтобы получить целочисленные значения, можно модифицировать код следующим образом:

In [None]:
Y, M, D = map(int, Date.split('-'))
print(Y, M, D)
h, m, s = map(int, Time.split(':'))
print(h, m, s)

2021 1 2
21 15 6


In [None]:
type(Y)

int

---

# Задание 3

Вам нужно написать функцию, которая из входного объекта datetime будет выделять следующую информацию:

1. Дата - в формате ***год-месяц-день***;
2. Год;
3. Месяц;
4. День;
5. Порядковый номер недели;
6. День недели (например, понедельник);
7. Время - в формате ***часы-минуты-секунды***;
8. Часы;
9. Минуты;
10. Секунды;
11. Количество секунд с начала дня.

Эту функцию необходимо применить к таблице, в которой уже есть колонка с datetime'ами, и добавить в эту таблицу 11 новых столбцов, содержащих в себе значения из пп. 1-11. Очередность и название столбцов такие же, как в списке выше.

Добиться результата можно различными способами.

Для получения исходной информации необходимо выполнить код:

In [86]:
from google.colab import drive  # если вы выполняете код из среды Google Colab, нужно подключить свой гугл-диск,
drive.mount('/content/drive')   # чтобы можно было оттуда считать файл с данными для этого задания

ModuleNotFoundError: No module named 'google'

In [253]:
# здесь и далее вам понадобится менять пути к файлам, поскольку в вашей системе вы их можете записать в другое место
import pandas as pd

data = pd.read_excel('../datasets/Даты.xlsx')
data

Unnamed: 0,datetime
0,2021-01-26 17:22:41
1,2013-04-18 14:44:04
2,2017-11-12 21:51:06
3,2001-09-14 22:48:09
4,2012-12-03 18:05:30
...,...
95,2002-04-06 14:45:02
96,2010-01-17 19:29:42
97,2016-09-20 13:10:02
98,2019-11-27 15:05:00


Добавлять значения в таблицу можно следующим образом:

In [5]:
new_values = ['новое значение' for j in range(100)]
data['Новый столбец'] = new_values
data

Unnamed: 0,datetime,Новый столбец
0,2021-01-26 17:22:41,новое значение
1,2013-04-18 14:44:04,новое значение
2,2017-11-12 21:51:06,новое значение
3,2001-09-14 22:48:09,новое значение
4,2012-12-03 18:05:30,новое значение
...,...,...
95,2002-04-06 14:45:02,новое значение
96,2010-01-17 19:29:42,новое значение
97,2016-09-20 13:10:02,новое значение
98,2019-11-27 15:05:00,новое значение


Сохранить полученный результат можно следующим образом:

In [None]:
nik_name = 'меня зовут'
data.to_excel('/content/drive/MyDrive/school21/day01/datasets/Даты '+nik_name+'.xlsx', index=False)

Для выполнения задания вам нужно будет сохранить новый файл в ту же папку, откуда мы берем файл Даты.xlsx

Good_luck = 'Удачи!'


---

# Задание 3

Вам нужно написать функцию, которая из входного объекта datetime будет выделять следующую информацию:

1. Дата - в формате ***год-месяц-день***;
2. Год;
3. Месяц;
4. День;
5. Порядковый номер недели;
6. День недели (например, понедельник);
7. Время - в формате ***часы-минуты-секунды***;
8. Часы;
9. Минуты;
10. Секунды;
11. Количество секунд с начала дня.

Эту функцию необходимо применить к таблице, в которой уже есть колонка с datetime'ами, и добавить в эту таблицу 11 новых столбцов, содержащих в себе значения из пп. 1-11. Очередность и название столбцов такие же, как в списке выше.

Добиться результата можно различными способами.

Для получения исходной информации необходимо выполнить код:

In [343]:
import pandas as pd
from datetime import datetime as dt, timedelta, date, time

df = pd.read_excel('../datasets/Даты.xlsx')
df.head()

Unnamed: 0,datetime
0,2021-01-26 17:22:41
1,2013-04-18 14:44:04
2,2017-11-12 21:51:06
3,2001-09-14 22:48:09
4,2012-12-03 18:05:30


In [345]:
def split_datetime(df):
    day_list = ('Понедельник', 'Вторник', 'Среда', 'Четверг', 'Пятница', 'Суббота', 'Воскресенье')
    df_datetime = df['datetime'].apply(lambda x: dt.strptime(x, '%Y-%m-%d %H:%M:%S'))
    
    df['date'] = df_datetime.apply(lambda x: str(x.date()))
    df['year'] = df_datetime.apply(lambda x: str(x.date()).split('-')[0])
    df['month'] = df_datetime.apply(lambda x: str(x.date()).split('-')[1])
    df['day'] = df_datetime.apply(lambda x: str(x.date()).split('-')[2])
    df['week_number'] = df_datetime.apply(lambda x: x.isocalendar()[1])
    df['weekday'] = df_datetime.apply(lambda x: day_list[x.isocalendar()[2] - 1])
    df['time'] = df_datetime.apply(lambda x: str(x.time()))
    df['hour'] = df_datetime.apply(lambda x: str(x.hour))
    df['min'] = df_datetime.apply(lambda x: str(x.minute))
    df['sec'] = df_datetime.apply(lambda x: str(x.second))
    df['sec_of_day'] = df_datetime.apply(lambda x: str(x.hour*3600 + x.minute*60 + x.second))
    
    return df

df = split_datetime(df)
df.head()
nik_name = 'Igarg'
df.to_excel('../datasets/Даты '+nik_name+'.xlsx', index=False)