### Сентябрь 2020 г. 
### DST 10 // Юнит 2. Разведывательный анализ данных // PYTHON-C1. Работа с датами

# 1.1 Введение

В этом модуле мы разберем работу с датами и временем. Это особый тип данных, с которым приходится сталкиваться в абсолютном большинстве задач по обработке данных. В реальных задачах даты нужно сравнивать, выделять день недели или час, прибавлять к ним различные интервалы.

В Python есть удобные инструменты для работы с датами в любом формате. Например, следующие стандартные форматы дат хорошо распознаются стандартными инструментами вроде Excel: 09.05.2019, 2018-12-31. Но в большинстве случаев даты будут поступать в совершенно любых вариантах. Примеры популярных форматов из баз данных и API:

- 2019-05-09Z15:34:55;
- 19 Apr 19, Fri, 01:27:34.112;
- 11:34 PM".

В каждом из этих примеров надо распознать дату и время — указать системе, где стоит год, где день и секунды. Мы на практических примерах освоим все основные методики и потренируемся в решении реальных задач.

# 1.2 Работа с датами на практике

Даты встречаются в большинстве данных, с которыми вам придётся работать на практике. Рассмотрим одну из таких задач.

Вам приходит ежедневный отчёт по доходам проекта. Как правило, системы, предоставляющие финансовые данные, обновляют эту информацию в течение нескольких дней, то есть данные по доходам за вчерашний день будут немного корректироваться в течение 2-3 дней. В таких случаях хорошей практикой является обновление связанных отчётов не только за вчерашний день, но и за несколько предыдущих. Иначе отчёт будет расходиться с реальными финансовыми показателями.

В таком случае необходимо задавать окно дат за последние несколько дней и запускать формирование отчёта за каждый из них. Например, если сегодня 2 марта, то пересчёт нужно запускать за последние 2 дня февраля и 1 марта. При этом нужно учитывать возможный високосный год. Для решения таких задач в Python есть множество готовых инструментов. Перед тем как познакомиться с ними, рассмотрим очень важный вопрос формата даты и времени.

# 1.3 Форматы дат и времени

## Форматы дат и времени
В жизни мы привыкаем видеть даты в привычных для нас форматах. Например, запись 01.12.18 обычно означает 1 декабря 2018 года. Однако для жителей США эта дата окажется 12 января 2018 года, так как для них привычнее сначала указывать номер месяца, а потом день. Excel с настройками для России распознает эту дату как 1 декабря, а в американской локализации — как 12 января.

Многие выгрузки из систем и баз данных имеют свой служебный формат. Например, формат времени из разных систем может отличаться:

- 2018-11-09 15:45:21;
- 11/09/2018 3:45:20 PM;
- 2018-11-09T15:45:21.2984.

Для всех этих случаев необходимо задавать формат распознавания дат, уметь сравнивать их между собой. Также часто необходимо корректно прибавлять к датам различные временные интервалы. Например, час или день.

## Задание

Какая из указанных дат является корректной в формате «день.месяц.год»?
- 02.29.2016 (число 29 не может означать месяц)
- 29.02.2018 (в этом году был не високосный год, а значит 29 февраля не было, но это не о формате дат)
- 29.02.2020 верно

# 1.4 Формат YYYY-MM-DD

## Формат YYYY-MM-DD
Даты, с которыми мы работали в прошлых шагах, являются просто строками. Python пока не знает, на каком месте указан год, на каком — день или час. Для распознавания дат в Python введены обозначения, которые помогут системе правильно распознать практически любой формат даты и времени. Для этого необходимо указать в коде, что означает каждая цифра и буква. Рассмотрим простой пример, когда дата задана в следующем формате:

        date_string = '2019-03-01'

Такой формат записи даты практичен и пользуется большой популярностью, так как в этой записи сортировка по алфавиту будет совпадать с календарем. Например, для привычного формата «01.03.2019» это неверно: в алфавитном порядке даты будут идти в другой последовательности, отличающейся от правильного порядка в календаре.

## Задание

Запишите дату 8 марта 2019 года в формате YYYY-MM-DD.
        
        Ответ: 2019-03-08

# 1.5 Распознавание дат в Python

## Распознавание дат в Python
Вернемся к переменной date_string. Что нужно, чтобы Python начал воспринимать эту строку как дату? Для начала необходимо явно указать, где в этой строке год, месяц и день:

- 2019 —год;
- 03 — месяц;
- 01 — день.

А также не забыть, что в такой записи между ними стоят дефисы «-». Для расшифровки даты и времени составлены таблицы:

- [официальная документация](https://docs.python.org/3/library/datetime.html 'таблица внизу страницы по ссылке')
- [вариант с русским переводом](https://all-python.ru/osnovy/modul-datetime.html 'таблица внизу страницы по ссылке')

Вместо чисел в переменной date_string надо подставить подходящие форматы из таблицы. Начнем с года: в таблице есть два варианта года:

- %y — номер года без указания столетия (например, 19 для года 2019);
- %Y — полный вариант записи (2019), который нам подходит.

Подставляем вместо года его формат: '%Y-03-01'

Теперь месяц. Видим в таблице три варианта:

- %b — сокращенное название месяца вроде Jan, Feb;
- %B — полное название месяца;
- %m — номер месяца в числовом представлении (наш вариант).

Добавляем расшифровку месяца: '%Y-%m-01'

______________________

Обратите внимание!

Формат даты зависит от регистра: %m — номер месяца, а %M будет количеством минут.

## Задание

Найдите формат дня месяца в таблице и укажите итоговый вариант даты:

        '%Y-%m-%d'

# 1.6 Сложные форматы даты и времени

## Сложные форматы даты и времени

В Python можно распознать любой тип даты.

Давайте укажем формат даты 2019-04-01T06:30:00 (6:30 утра 1 апреля 2019 года). Год, месяц и день мы уже расшифровали — их формат %Y-%m-%d.

Далее идёт буква T, как и любой символ в дате его надо указать в формате: %Y-%m-%dT06:30:00.

Далее идет номер часа: в таблице два варианта:

- %H — количество часов в 24-часовом формате;
- %I — количество часов в 12-часовом формате.

Нам подходят оба варианта. Для того, чтобы узнать точный вариант, необходимо выяснить пример даты после полудня. Используем вариант %H.

## Задание

Допишите форматы минут и секунд в нашем примере. Укажите полный вариант расшифровки формата даты 2019-04-01T06:30:00

        %Y-%m-%dT%H:%M:%S

# 1.7 Формат unixtime

## Формат unixtime

Популярным форматом записи даты и времени является unixtime (также POSIX-время). Это количество секунд, прошедших с полуночи 1 января 1970 года по часовой зоне UTC. Преимущество данного формата в его простоте: обычно это целое число. Также им удобно считать разницу между двумя датами: это будет разница двух чисел в секундах.

Переводить дату в unixtime и обратно можно с помощью кода на Python или специальных онлайн-сервисов, например, [onlineconversion](https://www.onlineconversion.com/unix_time.htm)

Пример перевода даты 16 апреля 2019 в формат unixtime

        1555395300        

На этом сайте используется американский формат ввода дат: сначала указывается месяц, потом день.

## Задание
Переведите дату 31 декабря 2018 года (полночь по UTC) в формат unixtime. Дайте ответ в виде целого числа:

        1546214400

# 1.8 Задания