# Обработка ошибок
1. Текст ошибки указывается в последней строчке
2. Все что перед ней - место, где ошибка произошла
3. Есть встроенные типы ошибок, но можно создавать и свои

Некоторые типы ошибок из документации (точнее [перевода](https://pythonworld.ru/tipy-dannyx-v-python/isklyucheniya-v-python-konstrukciya-try-except-dlya-obrabotki-isklyuchenij.html)):
- ZeroDivisionError - деление на ноль
- ImportError - не удалось импортирование модуля или его атрибута (надо установить эту библиотеку)
- IndexError - индекс не входит в диапазон элементов.
- KeyError - несуществующий ключ (в словаре, множестве или другом объекте)
- MemoryError - недостаточно памяти
- SyntaxError - синтаксическая ошибка (вы опечатались или не закрыли скобку)
- TypeError - операция применена к объекту несоответствующего типа
- ValueError - функция получает аргумент правильного типа, но некорректного значения
- Warning - предупреждение (текст на красном фоне в юпитере это предупреждение, а не ошибка)

In [None]:
# эту строку можно перевести в число
some_num = '123'

In [None]:
float(some_num)

In [None]:
# а эту уже нет (по крайней мере в десятичном счислении)
ups = '123a'

In [None]:
# ValueError - тип ошибки, далее пояснение что произошло
# ----> 1 float(ups) - в каком месте кода произошла ошибка
float(ups)

Пример ошибки внутри функции

In [None]:
def square_sum(*args):
    total_sum = 0
    for arg in args:
        total_sum += arg**2
    
    return total_sum

In [None]:
square_sum(1, 2, 3)

In [None]:
# пытаемся применить к операцию возведения в квадрат к строке
# ----> 1 square_sum(1, 2, '3') - в какой функции произошла ошибка
# ----> 4         total_sum += arg**2 - в какой именно строке произошла ошибка

square_sum(1, 2, '3')

## Как сделать, чтобы цикл с расчетом не падал каждый раз

In [None]:
try:
    # ваш код, где может произойти ошибка
    float('123a')

except:
    # код, который выполняется в случае ошибки
    

In [None]:
data = ['90', '60', '90', '240tot']
total_sum = 0

for num in data:
    try:
        total_sum += float(num)

    except:
        print('Ошибка в данных: {}'.format(num))
    
print('Итого', total_sum)

Как сохранить всю информацию об ошибке?

In [None]:
# полная версия traceback
import traceback

try:
    float('123fff')

except Exception:
    print(traceback.print_exc())
    
print('Проехали')

### Упражнение
Создайте словарь stats = {'monday': 100, 'tuesday': 200}. 

Какой тип ошибки вызовет обращение stats['wednesday']?

In [1]:

stats = {'monday': 100, 'tuesday': 200}

print(stats['wednesday'])

KeyError: 'wednesday'

### Блок finally

In [None]:
try:
    print(stats["wednesday"])
    
except IndexError:
    print("Ошибка индекса")
    
except KeyError:
    print("Ошибка ключа")
    print(1/0)
    
finally:
    print('Эта строчка будет выполнена всегда')

### Более жизненный пример

In [2]:
with open('real_data.txt', 'r') as f:
    for line in f:
        print(line.strip())

05.10.16 23:18	1010	20,2
09.10.2016T 21:40:00	1036	15,6
05.10.16 3:23	1041
05.10.16 23:19	1041
01.10.16 4:57	1042	14,8
01.10.16 23:29	1042	14,4
03.10.16 20:20	1042	14
04.10.16 0:35	1042	20
04.10.16 13:46	1042	16,2
04.10.16 17:34	1042	11
05.10.16 15:15	1042	10800000
06.10.16 20:45	1042	22,6
07.10.16 2:54	1042	22,4
07.10.16 5:02	1042	24,4
07.10.16 6:35	1042	16,6
08.10.2016T 16:46:00	1042	8,6
01.10.16 13:39	1047
05.10.16 21:41	1047
07.10.16 9:59	1052	24
08.10.2016T 19:36:00	1052	18,8
04.10.16 11:12	1057
09.10.2016T 2:47:00	1057
09.10.2016T 16:27:00	1062	11,2
05.10.16 4:38	1067	19
04.10.16 9:56	1078	23,4
04.10.16 14:36	1085	17
05.10.16 16:41	1096	20,8
01.10.16 11:55	1098	15,6
01.10.16 14:16	1100
02.10.16 1:39	1100
02.10.16 2:49	1100
02.10.16 13:05	1100
03.10.16 4:04	1100
03.10.16 6:58	1100
03.10.16 15:01	1100
04.10.16 23:43	1100
05.10.16 5:46	1100
06.10.16 0:31	1100
06.10.16 9:25	1100
08.10.2016T 15:15:00	1100
07.10.16 9:06	1105	16,2
01.10.16 4:30	1108	17,8
01.10.16 18:16	1108	18,8
02.10.1

Чем прекрасен этот файл:
1. Даты имеют разный формат: за 8 и 9 октября формат с "09.10.2016 21:40" сменился на "09.10.2016T 21:40:00" (добавилась буква T и секунды). Разработчики объяснили этот тем, что сбились настройки после обновления одной из баз данных.
2. У покупок некоторых пользователей неизвестно значение выручки, из-за чего количество столбцов в строке уменьшается на один.
3. У некоторых строк реальная сумма покупки умножена на миллион. Так иногда действительно делают, чтобы избежать дробных чисел и работать только с целыми.

### Упражнение
Посчитайте сумму выручки из третьего столбца. Пока не обращайте внимания на помноженную на миллион выручку.

In [4]:
import json
import traceback


def calc_money():
    analiz_sum = 0
    with open('real_data.txt', 'r') as file:
        for line in file:
            line_upd = line.split(" ")
            line_upd_add = line_upd[1].split("\t")
            innit_num = (line_upd_add[2][:-1])
            try:
                innit_num_add = innit_num.replace(",", ".")
                analiz_sum += float(innit_num_add)
            except:
                print(traceback.print_exc())
    print(analiz_sum)
calc_money()






None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
198203147.8000001


Traceback (most recent call last):
  File "C:\Users\VAS-PC-IDE\AppData\Local\Temp\ipykernel_3280\2092130484.py", line 14, in calc_money
    analiz_sum += float(innit_num_add)
                  ^^^^^^^^^^^^^^^^^^^^
ValueError: could not convert string to float: ''
Traceback (most recent call last):
  File "C:\Users\VAS-PC-IDE\AppData\Local\Temp\ipykernel_3280\2092130484.py", line 14, in calc_money
    analiz_sum += float(innit_num_add)
                  ^^^^^^^^^^^^^^^^^^^^
ValueError: could not convert string to float: ''
Traceback (most recent call last):
  File "C:\Users\VAS-PC-IDE\AppData\Local\Temp\ipykernel_3280\2092130484.py", line 14, in calc_money
    analiz_sum += float(innit_num_add)
                  ^^^^^^^^^^^^^^^^^^^^
ValueError: could not convert string to float: ''
Traceback (most recent call last):
  File "C:\Users\VAS-PC-IDE\AppData\Local\Temp\ipykernel_3280\2092130484.py", line 14, in calc_money
    analiz_sum += float(innit_num_add)
                  ^^^^^^^^^^^^^^^

# Даты

In [None]:
# иногда импортируют так
import datetime

In [None]:
# можно и так
import datetime as dt

In [None]:
# у нас будет вариант покороче (но это не одно и то же)
from datetime import datetime

In [None]:
date_string = '09.05.2018  09:00'

In [None]:
# сейчас date_string это просто строка
type(date_string)

In [None]:
datetime.strptime('09.05.2018 09:00', '%d.%m.%Y %H:%M')

In [None]:
# https://docs.python.org/3/library/datetime.html

date_datetime = datetime.strptime( date_string, '%d.%m.%Y %H:%M' )
date_datetime

In [None]:
# теперь можем работать с датами
type(date_datetime)

In [None]:
# получить номер года и часа
date_datetime.year, date_datetime.hour

In [None]:
# день недели
date_datetime.weekday()

In [None]:
# сегодня
datetime.now()

### Упражнение
С помощью метода datetime.strptime переведите строку 'May 25 2017 5:00AM' в формат datetime.

In [13]:
from datetime import datetime, timedelta
date_string = "May 25 2017 5:00AM"
date_datetime = datetime.strptime(date_string, "%b %d %Y %I:%M%p" )


print(type(date_datetime))
print(date_datetime.year)
print(date_datetime.hour)
print(date_datetime.weekday())
print(datetime.now())

<class 'datetime.datetime'>
2017
5
3
2023-02-19 14:56:38.586772


### Прибавление интервала к датам

In [8]:
from datetime import timedelta

In [7]:
start_date = '2018-01-01'
end_date = '2018-01-07'

In [6]:
type(start_date)


str

In [14]:
start_date_datetime = datetime.strptime(start_date, '%Y-%m-%d')
start_date_datetime

datetime.datetime(2018, 1, 1, 0, 0)

In [15]:
start_date_datetime + timedelta(days=1)

datetime.datetime(2018, 1, 2, 0, 0)

In [10]:
start_date_datetime + timedelta(days=-7, minutes=-1)

datetime.datetime(2017, 12, 24, 23, 59)

### Упражнение
Дана дата в формате '2018-09-01T09:30:00'. Прибавьте к ней 12 часов 15минут и 3 секунды.

In [9]:
from datetime import datetime, timedelta

date_inf = '2018-09-01T09:30:00'
start_date_inf = datetime.strptime(date_inf, '%Y-%m-%dT%H:%M:%S')
print(f"{start_date_inf}")
delta_time = start_date_inf + timedelta(hours=12, minutes=15, seconds=3)
print(f"{delta_time}")

NameError: name 'datetime' is not defined

### Перевод обратно в строку

In [17]:
date = datetime(2018, 9, 1)
date

datetime.datetime(2018, 9, 1, 0, 0)

In [18]:
date.strftime('%Y-%m-%d')

'2018-09-01'

In [19]:
date.strftime('%B %d %Y %I:%M%p')

'September 01 2018 12:00AM'

In [20]:
datetime.now().strftime('%Y-%m-01')

'2023-02-01'

In [16]:
# как получить первый день месяца

date.strftime('%Y-%m-01')


NameError: name 'date' is not defined

In [11]:
start_date = '2018-01-01'
end_date = '2018-01-07'

In [12]:
start_date, end_date

('2018-01-01', '2018-01-07')

In [22]:

start_date = '2018-01-01'
end_date = '2018-01-07'
start_date_dt = datetime.strptime(start_date, '%Y-%m-%d')
end_date_dt = datetime.strptime(end_date, '%Y-%m-%d')

print(start_date_dt, end_date_dt)

2018-01-01 00:00:00 2018-01-07 00:00:00


In [18]:
i = 0

while i < 10:
    # ...
    i += 1
    print(i)

1
2
3
4
5
6
7
8
9
10


In [19]:
current_dt = start_date_dt

while current_dt <= end_date_dt:
    print(current_dt.strftime('%Y-%m-%d'))
    
    current_dt += timedelta(days=1)

2018-01-01
2018-01-02
2018-01-03
2018-01-04
2018-01-05
2018-01-06
2018-01-07


In [37]:
current_dt = start_date_dt

while current_dt.strftime('%Y-%m-%d') <= end_date:
    print(current_dt.strftime('%Y-%m-%d'))
    
    current_dt += timedelta(days=1)

2018-09-01
2018-09-02
2018-09-03
2018-09-04
2018-09-05
2018-09-06
2018-09-07


In [35]:
# можно и с помощью list comprehension
[(start_date_dt + timedelta(days=x)).strftime('%Y-%m-%d') for x in range(10)]

['2018-09-01',
 '2018-09-02',
 '2018-09-03',
 '2018-09-04',
 '2018-09-05',
 '2018-09-06',
 '2018-09-07',
 '2018-09-08',
 '2018-09-09',
 '2018-09-10']

### Упражнение
Напишите алгоритм, который "пробегает" период 1 до 7 сентября по часам. Формат вывода '06.01.2018 23:00:00'.

In [56]:

start_date = '2018-09-01 T:00:00:00'
end_date = '2018-09-07 T:00:00:00'
start_date_dt = datetime.strptime(start_date, '%Y-%m-%d T:%H:%M:%S')
end_date_dt = datetime.strptime(end_date, '%Y-%m-%d T:%H:%M:%S')
print(start_date_dt, end_date_dt)
[(start_date_dt + timedelta(hours=x)).strftime('%Y-%m-%d T:%H:%M:%S') for x in range(24 * 7)]

2018-09-01 00:00:00 2018-09-07 00:00:00


['2018-09-01 T:00:00:00',
 '2018-09-01 T:01:00:00',
 '2018-09-01 T:02:00:00',
 '2018-09-01 T:03:00:00',
 '2018-09-01 T:04:00:00',
 '2018-09-01 T:05:00:00',
 '2018-09-01 T:06:00:00',
 '2018-09-01 T:07:00:00',
 '2018-09-01 T:08:00:00',
 '2018-09-01 T:09:00:00',
 '2018-09-01 T:10:00:00',
 '2018-09-01 T:11:00:00',
 '2018-09-01 T:12:00:00',
 '2018-09-01 T:13:00:00',
 '2018-09-01 T:14:00:00',
 '2018-09-01 T:15:00:00',
 '2018-09-01 T:16:00:00',
 '2018-09-01 T:17:00:00',
 '2018-09-01 T:18:00:00',
 '2018-09-01 T:19:00:00',
 '2018-09-01 T:20:00:00',
 '2018-09-01 T:21:00:00',
 '2018-09-01 T:22:00:00',
 '2018-09-01 T:23:00:00',
 '2018-09-02 T:00:00:00',
 '2018-09-02 T:01:00:00',
 '2018-09-02 T:02:00:00',
 '2018-09-02 T:03:00:00',
 '2018-09-02 T:04:00:00',
 '2018-09-02 T:05:00:00',
 '2018-09-02 T:06:00:00',
 '2018-09-02 T:07:00:00',
 '2018-09-02 T:08:00:00',
 '2018-09-02 T:09:00:00',
 '2018-09-02 T:10:00:00',
 '2018-09-02 T:11:00:00',
 '2018-09-02 T:12:00:00',
 '2018-09-02 T:13:00:00',
 '2018-09-02

In [41]:
current_dt = start_date_dt
while current_dt.strftime('%Y-%m-%d T:%H:%M:%S') <= end_date:
    print(current_dt.strftime('%Y-%m-%d T:%H:%M:%S'))

    current_dt += timedelta(hours=1)

2018-09-01 T:00:00:00
2018-09-01 T:01:00:00
2018-09-01 T:02:00:00
2018-09-01 T:03:00:00
2018-09-01 T:04:00:00
2018-09-01 T:05:00:00
2018-09-01 T:06:00:00
2018-09-01 T:07:00:00
2018-09-01 T:08:00:00
2018-09-01 T:09:00:00
2018-09-01 T:10:00:00
2018-09-01 T:11:00:00
2018-09-01 T:12:00:00
2018-09-01 T:13:00:00
2018-09-01 T:14:00:00
2018-09-01 T:15:00:00
2018-09-01 T:16:00:00
2018-09-01 T:17:00:00
2018-09-01 T:18:00:00
2018-09-01 T:19:00:00
2018-09-01 T:20:00:00
2018-09-01 T:21:00:00
2018-09-01 T:22:00:00
2018-09-01 T:23:00:00
2018-09-02 T:00:00:00
2018-09-02 T:01:00:00
2018-09-02 T:02:00:00
2018-09-02 T:03:00:00
2018-09-02 T:04:00:00
2018-09-02 T:05:00:00
2018-09-02 T:06:00:00
2018-09-02 T:07:00:00
2018-09-02 T:08:00:00
2018-09-02 T:09:00:00
2018-09-02 T:10:00:00
2018-09-02 T:11:00:00
2018-09-02 T:12:00:00
2018-09-02 T:13:00:00
2018-09-02 T:14:00:00
2018-09-02 T:15:00:00
2018-09-02 T:16:00:00
2018-09-02 T:17:00:00
2018-09-02 T:18:00:00
2018-09-02 T:19:00:00
2018-09-02 T:20:00:00
2018-09-02

### Нагрузка на систему по часам

In [46]:
stats = {}

with open('logs.csv', 'r') as f:
    for line in f:
        line = line.strip()
        print(line)
        
        break
        
        # вычисления нагрузки на систему...
        
# результат
stats

2018-04-30T21:37:41Z


{}

In [None]:
# а в процентном соотношении?


###  Unixtime
Количество секунд, прошедших с 1 января 1970 года по UTC

In [47]:
import time
from datetime import date
from datetime import datetime

In [48]:
d = date(2019, 3, 11)

unixtime = time.mktime(d.timetuple())
unixtime

1552251600.0

In [49]:
from datetime import datetime

In [50]:
datetime.fromtimestamp(1552251600)

datetime.datetime(2019, 3, 11, 0, 0)

На практике все сложнее https://habr.com/ru/post/452584/

# Задача про интервалы
Имеется список отсортированных по возрастанию целых чисел data. А также целое число n, которое лежит между минимальным и максимальным значениями из списка data. Вам необходимо определить минимальное ближайшее число к n из списка data.

Пример:
```python
data = [1, 7, 17, 23, 27, 35, 65]
n = 20
```

Ответ: 17

Подобные алгоритмы используются для классификации объекта по значению одной метрики. Например, это может пригодиться для классификации учащегося по его возрасту:
```python
ages = {
    1: 'дети',
    7: 'школьники',
    17: 'студенты',
    23: 'аспиранты',
    27: 'молодые ученые',
    35: 'преподаватели',
    65: 'пенсионеры',
}
```

Итого напишите функцию, которая по списку data и числу n возвращает минимальное ближайшее к n число. Список может быть любым, поэтому не рассчитывайте на написание цепочки условий через if.

Бонусные варианты:
1. Рассмотрите ситуацию, в которой при фиксированном списке data вам необходимо классифицировать большое количество пользователей с разными значениями n. Например, вам необходимо классифицировать базу из 100 миллионов человек по возрастам по словарю ages из примера выше. Можно ли в таком случае ускорить проход по такому числу пользователей?

2. Если вы решали основное задание перебором элементов списка data и сравнением с n, то сложность такого алгоритма O(N). Т. е. при увеличении числа элементов списка data в N раз время работы алгоритма тоже вырастет в N раз. Попробуйте ускорить этот алгоритм. Например, с помощью аналога бинарного поиска.

In [55]:

# data = [1, 7, 17, 23, 27, 35, 65]
# n = 20
def optimal_numb(data, n):
    min_arg = 0
    max_arg = 0
    if n not in data:
        for _, __ in enumerate(data):
            if n < __:
                max_arg = __
                min_arg = data[_ - 1]
                break
        result_dic = {}
        result_dic[min_arg] = abs(min_arg - n)
        result_dic[max_arg] = abs(max_arg - n)
        keys_dd = list(result_dic.keys())
        values_dd = list(result_dic.values())
        if values_dd[0] == values_dd[1]:
            print(f"{keys_dd[0]}")
            return keys_dd[0]
        elif values_dd[0] > values_dd[1]:
            print(f"{keys_dd[1]}")
            return keys_dd[1]
        else:
            print(f"{keys_dd[0]}")
            result_dic[0]
    else:
        print(f"{n}")
        return f"{n}"
optimal_numb([1, 7, 17, 23, 27, 35, 65], 20)




17


17