# Обработка ошибок
1. Текст ошибки указывается в последней строчке
2. Все что перед ней - место, где ошибка произошла
3. Есть встроенные типы ошибок, но можно создавать и свои

Некоторые типы ошибок из документации (точнее [перевода](https://pythonworld.ru/tipy-dannyx-v-python/isklyucheniya-v-python-konstrukciya-try-except-dlya-obrabotki-isklyuchenij.html)):
- ZeroDivisionError - деление на ноль
- ImportError - не удалось импортирование модуля или его атрибута (надо установить эту библиотеку)
- IndexError - индекс не входит в диапазон элементов.
- KeyError - несуществующий ключ (в словаре, множестве или другом объекте)
- MemoryError - недостаточно памяти
- SyntaxError - синтаксическая ошибка (вы опечатались или не закрыли скобку)
- TypeError - операция применена к объекту несоответствующего типа
- ValueError - функция получает аргумент правильного типа, но некорректного значения
- Warning - предупреждение (текст на красном фоне в юпитере это предупреждение, а не ошибка)

In [None]:
# эту строку можно перевести в число
some_num = '123'

In [None]:
float(some_num)

In [None]:
# а эту уже нет (по крайней мере в десятичном счислении)
ups = '123a'

In [None]:
# ValueError - тип ошибки, далее пояснение что произошло
# ----> 1 float(ups) - в каком месте кода произошла ошибка
float(ups)

Пример ошибки внутри функции

In [None]:
def square_sum(*args):
    total_sum = 0
    for arg in args:
        total_sum += arg**2
    
    return total_sum

In [None]:
square_sum(1, 2, 3)

In [None]:
# пытаемся применить к операцию возведения в квадрат к строке
# ----> 1 square_sum(1, 2, '3') - в какой функции произошла ошибка
# ----> 4         total_sum += arg**2 - в какой именно строке произошла ошибка

square_sum(1, 2, '3')

## Как сделать, чтобы цикл с расчетом не падал каждый раз

In [None]:
try:
    # ваш код, где может произойти ошибка
    float('123a')

except:
    # код, который выполняется в случае ошибки
    

In [None]:
data = ['90', '60', '90', '240tot']
total_sum = 0

for num in data:
    try:
        total_sum += float(num)

    except:
        print('Ошибка в данных: {}'.format(num))
    
print('Итого', total_sum)

Как сохранить всю информацию об ошибке?

In [None]:
# полная версия traceback
import traceback

try:
    float('123fff')

except Exception:
    print(traceback.print_exc())
    
print('Проехали')

### Упражнение
Создайте словарь stats = {'monday': 100, 'tuesday': 200}. 

Какой тип ошибки вызовет обращение stats['wednesday']?

### Блок finally

In [None]:
try:
    print(stats["wednesday"])
    
except IndexError:
    print("Ошибка индекса")
    
except KeyError:
    print("Ошибка ключа")
    print(1/0)
    
finally:
    print('Эта строчка будет выполнена всегда')

### Более жизненный пример

In [None]:
with open('real_data.txt', 'r') as f:
    for line in f:
        print(line.strip())

Чем прекрасен этот файл:
1. Даты имеют разный формат: за 8 и 9 октября формат с "09.10.2016 21:40" сменился на "09.10.2016T 21:40:00" (добавилась буква T и секунды). Разработчики объяснили этот тем, что сбились настройки после обновления одной из баз данных.
2. У покупок некоторых пользователей неизвестно значение выручки, из-за чего количество столбцов в строке уменьшается на один.
3. У некоторых строк реальная сумма покупки умножена на миллион. Так иногда действительно делают, чтобы избежать дробных чисел и работать только с целыми.

### Упражнение
Посчитайте сумму выручки из третьего столбца. Пока не обращайте внимания на помноженную на миллион выручку.

# Даты

In [None]:
# иногда импортируют так
import datetime

In [None]:
# можно и так
import datetime as dt

In [None]:
# у нас будет вариант покороче (но это не одно и то же)
from datetime import datetime

In [None]:
date_string = '09.05.2018  09:00'

In [None]:
# сейчас date_string это просто строка
type(date_string)

In [None]:
datetime.strptime('09.05.2018 09:00', '%d.%m.%Y %H:%M')

In [None]:
# https://docs.python.org/3/library/datetime.html

date_datetime = datetime.strptime( date_string, '%d.%m.%Y %H:%M' )
date_datetime

In [None]:
# теперь можем работать с датами
type(date_datetime)

In [None]:
# получить номер года и часа
date_datetime.year, date_datetime.hour

In [None]:
# день недели
date_datetime.weekday()

In [None]:
# сегодня
datetime.now()

### Упражнение
С помощью метода datetime.strptime переведите строку 'May 25 2017 5:00AM' в формат datetime.

### Прибавление интервала к датам

In [None]:
from datetime import timedelta

In [None]:
start_date = '2018-01-01'
end_date = '2018-01-07'

In [None]:
type(start_date)

In [None]:
start_date_datetime = datetime.strptime(start_date, '%Y-%m-%d')
start_date_datetime

In [None]:
start_date_datetime + timedelta(days=1)

In [None]:
start_date_datetime + timedelta(days=-7, minutes=-1)

### Упражнение
Дана дата в формате '2018-09-01T09:30:00'. Прибавьте к ней 12 часов 15минут и 3 секунды.

### Перевод обратно в строку

In [None]:
date = datetime(2018, 9, 1)
date

In [None]:
date.strftime('%Y-%m-%d')

In [None]:
date.strftime('%B %d %Y %I:%M%p')

In [None]:
datetime.now().strftime('%Y-%m-01')

In [None]:
# как получить первый день месяца

date.strftime('%Y-%m-01')

In [None]:
start_date = '2018-01-01'
end_date = '2018-01-07'

In [None]:
start_date, end_date

In [None]:
start_date_dt = datetime.strptime(start_date, '%Y-%m-%d')
end_date_dt = datetime.strptime(end_date, '%Y-%m-%d')

print(start_date_dt, end_date_dt)

In [None]:
i = 0

while i < 10:
    # ...
    i += 1
    print(i)

In [None]:
current_dt = start_date_dt

while current_dt <= end_date_dt:
    print(current_dt.strftime('%Y-%m-%d'))
    
    current_dt += timedelta(days=1)

In [None]:
current_dt = start_date_dt

while current_dt.strftime('%Y-%m-%d') <= end_date:
    print(current_dt.strftime('%Y-%m-%d'))
    
    current_dt += timedelta(days=1)

In [None]:
# можно и с помощью list comprehension
[(start_date_dt + timedelta(days=x)).strftime('%Y-%m-%d') for x in range(10)]

### Упражнение
Напишите алгоритм, который "пробегает" период 1 до 7 сентября по часам. Формат вывода '06.01.2018 23:00:00'.

### Нагрузка на систему по часам

In [None]:
stats = {}

with open('logs.csv', 'r') as f:
    for line in f:
        line = line.strip()
        print(line)
        
        break
        
        # вычисления нагрузки на систему...
        
# результат
stats

In [None]:
# а в процентном соотношении?


###  Unixtime
Количество секунд, прошедших с 1 января 1970 года по UTC

In [None]:
import time
from datetime import date
from datetime import datetime

In [None]:
d = date(2019, 3, 11)

unixtime = time.mktime(d.timetuple())
unixtime

In [None]:
from datetime import datetime

In [None]:
datetime.fromtimestamp(1552251600)

На практике все сложнее https://habr.com/ru/post/452584/

# Задача про интервалы
Имеется список отсортированных по возрастанию целых чисел data. А также целое число n, которое лежит между минимальным и максимальным значениями из списка data. Вам необходимо определить минимальное ближайшее число к n из списка data.

Пример:
```python
data = [1, 7, 17, 23, 27, 35, 65]
n = 20
```

Ответ: 17

Подобные алгоритмы используются для классификации объекта по значению одной метрики. Например, это может пригодиться для классификации учащегося по его возрасту:
```python
ages = {
    1: 'дети',
    7: 'школьники',
    17: 'студенты',
    23: 'аспиранты',
    27: 'молодые ученые',
    35: 'преподаватели',
    65: 'пенсионеры',
}
```

Итого напишите функцию, которая по списку data и числу n возвращает минимальное ближайшее к n число. Список может быть любым, поэтому не рассчитывайте на написание цепочки условий через if.

Бонусные варианты:
1. Рассмотрите ситуацию, в которой при фиксированном списке data вам необходимо классифицировать большое количество пользователей с разными значениями n. Например, вам необходимо классифицировать базу из 100 миллионов человек по возрастам по словарю ages из примера выше. Можно ли в таком случае ускорить проход по такому числу пользователей?

2. Если вы решали основное задание перебором элементов списка data и сравнением с n, то сложность такого алгоритма O(N). Т. е. при увеличении числа элементов списка data в N раз время работы алгоритма тоже вырастет в N раз. Попробуйте ускорить этот алгоритм. Например, с помощью аналога бинарного поиска.

In [1]:
# Основная задача

def closest(sequence, number):
    for x in sequence:
        if number == x:
            print(x)
            break
        elif number > x:
            continue
        elif number < x:
            number_high = x
            number_low = sequence[sequence.index(x) - 1] 
            print(number_low)
            break

In [2]:
data = [1, 7, 17, 23, 27, 35, 65]
n = 20
closest(data, n)

17


In [3]:
# Это то же самое, но с return. Сделано, чтобы значительно сократить работу в первом бонусном варианте.

def closest_out(sequence, number):
    for x in sequence:
        if number == x:
            return x
            break
        elif number > x:
            continue
        elif number < x:
            number_high = x
            number_low = sequence[sequence.index(x) - 1] 
            return number_low
            break

In [4]:
data = [1, 7, 17, 23, 27, 35, 65]
n = 20
closest_out(data, n)

17

In [5]:
# Бонус 1

def age_to_position(list_of_ages, dict_of_positions):
    list_of_divisions = list(dict_of_positions.keys())
    list_of_divisions = list_of_divisions + [120] # условно добавил максимально возможный возраст
#     print(list_of_divisions) # вывожу справочно
    for x in list_of_ages:
        age_to_define = closest_out(list_of_divisions, x) # использую самодельную функцию из первого задания, получаю минимальоне ближайшее число
        print(f'Возраст {x} соотвествует группе {dict_of_positions[age_to_define]}')

In [6]:
data = [1, 3, 4, 16, 16, 20, 23, 30, 38, 38, 41, 46, 54, 55, 64, 65, 67, 72, 79, 83] # список из случайных чисел от 0 до 85
ages = {
    1: 'дети',
    7: 'школьники',
    17: 'студенты',
    23: 'аспиранты',
    27: 'молодые ученые',
    35: 'преподаватели',
    65: 'пенсионеры',
}
age_to_position(data, ages)

Возраст 1 соотвествует группе дети
Возраст 3 соотвествует группе дети
Возраст 4 соотвествует группе дети
Возраст 16 соотвествует группе школьники
Возраст 16 соотвествует группе школьники
Возраст 20 соотвествует группе студенты
Возраст 23 соотвествует группе аспиранты
Возраст 30 соотвествует группе молодые ученые
Возраст 38 соотвествует группе преподаватели
Возраст 38 соотвествует группе преподаватели
Возраст 41 соотвествует группе преподаватели
Возраст 46 соотвествует группе преподаватели
Возраст 54 соотвествует группе преподаватели
Возраст 55 соотвествует группе преподаватели
Возраст 64 соотвествует группе преподаватели
Возраст 65 соотвествует группе пенсионеры
Возраст 67 соотвествует группе пенсионеры
Возраст 72 соотвествует группе пенсионеры
Возраст 79 соотвествует группе пенсионеры
Возраст 83 соотвествует группе пенсионеры


In [7]:
# Бонус 2
# Аналог бинарного поиска:

def closest_binary(sequence, number):
    index_low = 0
    index_mid = len(sequence) // 2
    index_high = len(sequence) - 1
    
#     if (sequence[0] > number) or (sequence[-1] < number): 
#         print('Число за пределами списка')
    if number in sequence:
        print(number)
    else:
        while index_low != index_mid:
            if number > sequence[index_mid]:
                index_low = index_mid
            else:
                index_high = index_mid
            index_mid = (index_low + index_high) // 2
        number_low = sequence[index_low]
        print(number_low)

In [8]:
data = [1, 7, 17, 23, 27, 35, 65]
n = 20
closest_binary(data, n)

17


**ДОМАШНЕЕ ЗАДАНИЕ ИЗ ЛИЧНОГО КАБИНЕТА**

**Задание 1**  
Напишите функцию date_range, которая возвращает список дней между датами start_date и end_date. Даты должны вводиться в формате YYYY-MM-DD.

In [1]:
from datetime import datetime
from datetime import timedelta

def date_range(start_date, end_date):
    list_of_dates = []
    start_date_dt = datetime.strptime(start_date, '%Y-%m-%d')
    end_date_dt = datetime.strptime(end_date, '%Y-%m-%d')
    while start_date_dt <= end_date_dt:
        list_of_dates.append(start_date_dt.strftime('%Y-%m-%d'))
        start_date_dt = start_date_dt + timedelta(days=1)
    return list_of_dates

In [2]:
start_date = '2020-03-25'
end_date = '2020-04-05'
date_range(start_date, end_date)

['2020-03-25',
 '2020-03-26',
 '2020-03-27',
 '2020-03-28',
 '2020-03-29',
 '2020-03-30',
 '2020-03-31',
 '2020-04-01',
 '2020-04-02',
 '2020-04-03',
 '2020-04-04',
 '2020-04-05']

**Задание 2**  
Дополните функцию из первого задания проверкой на корректность дат. В случае неверного формата или если start_date > end_date должен возвращаться пустой список.

In [3]:
from datetime import datetime
from datetime import timedelta

def date_range_edited(start_date, end_date):
    list_of_dates = []
    try:
        start_date_dt = datetime.strptime(start_date, '%Y-%m-%d')
        end_date_dt = datetime.strptime(end_date, '%Y-%m-%d')
        while start_date_dt <= end_date_dt:
            list_of_dates.append(start_date_dt.strftime('%Y-%m-%d'))
            start_date_dt = start_date_dt + timedelta(days=1)
    except:
        return list_of_dates
    return list_of_dates

In [4]:
start_date = '2020-03-25'
end_date = '2020-04-99'
date_range_edited(start_date, end_date)

[]

**Задание 3**  
Дан поток дат в формате YYYY-MM-DD, в которых встречаются некорректные значения:
stream = [‘2018-04-02’, ‘2018-02-29’, ‘2018-19-02’]  
Напишите функцию, которая проверяет эти даты на корректность. Т. е. для каждой даты возвращает True (дата корректна) или False (некорректная дата).

In [5]:
from datetime import datetime

def correct_date(dates_list):
    for date in dates_list:
        try:
            datetime.strptime(date, '%Y-%m-%d')
            print(date, True)
        except:
            print(date, False)

In [6]:
stream = ['2018-04-02', '2018-02-29', '2018-19-02']
correct_date(stream)

2018-04-02 True
2018-02-29 False
2018-19-02 False


**Задание 4 (бонусное)**  
Ваш коллега прислал код функции:

DEFAULT_USER_COUNT = 3  

def delete_and_return_last_user(region, default_list=[‘A100’, ‘A101’, ‘A102’]):  
""“  
Удаляет из списка default_list последнего пользователя и возвращает ID нового последнего пользователя.  
”""  
element_to_delete = default_list[-1]  
default_list.remove(element_to_delete)

return default_list[DEFAULT_USER_COUNT-2]  

При однократном вызове этой функции все работает корректно:  
delete_and_return_last_user(1)  
‘A101’

Однако, при повторном вызове получается ошибка IndexError: list index out of range.

**Задание:**

1. Что значит ошибка list index out of range?  
2. Почему при первом запуске функция работает корректно, а при втором - нет?

In [7]:
DEFAULT_USER_COUNT = 3
def delete_and_return_last_user(region, default_list=['A100', 'A101', 'A102']):
    """
    Удаляет из списка default_list последнего пользователя
    и возвращает ID нового последнего пользователя.
    """
    element_to_delete = default_list[-1]
    default_list.remove(element_to_delete)

    return default_list[DEFAULT_USER_COUNT-2]

In [8]:
# Запускаем первый раз
delete_and_return_last_user(1)

'A101'

In [9]:
# Запускаем второй раз
delete_and_return_last_user(1)

IndexError: list index out of range

**Ответы на вопросы:**  
1. list index out of range - означает, что мы обращаемся к индексу, которого не существует в данном списке
2. При первом запуске мы удаляем последний элемент 'A102', а затем обращаемся к индексу 1 в списке ['A100', 'A101']. Соотвественно, получаем 'A101'. При втором запуске мы удаляем новый последний элемент 'A101', получаем список ['A100'] и опять  обращаемся к индексу 1, а такого индекса в списке уже нет. Отсюда и ошибка, сообщающая, что мы обращаемся к несуществующему индексу.