# Задача про интервалы
Имеется список отсортированных по возрастанию целых чисел data. А также целое число n, которое лежит между минимальным и максимальным значениями из списка data. Вам необходимо определить минимальное ближайшее число к n из списка data.

Пример:
```python
data = [1, 7, 17, 23, 27, 35, 65]
n = 20
```

Ответ: 17



In [1]:
data = [1, 7, 17, 23, 27, 35, 65]
n = 20

In [8]:
for i, item in enumerate(data[:-1]):
    if item <= n < data[i+1]:
        print(item)
        break

17


# Бинарный поиск

O(log(N))

In [None]:
2 +1 шаг
4 +2 шага
8 +3 шага

2**N

In [None]:
Алеексеев - 3-57-94
Беляев
...
Волков  <--
...
<--
Дроздов
...
Иванов  <--
...
Яблоков

### Сложность алгоритма

O(f(N))

In [None]:
O(N) x N

In [None]:
100 --> 1 мин
1000 --> 10 мин

In [None]:
O(N**2) x N --> N**2
100сек --> 1000 --> 10**6

# Алгоритм экспоненциальной задержки

In [None]:
'https://www.cbr-xml-daily.ru/daily_json.js'

In [1]:
import requests

In [8]:
def exchange_rates(host, timeout):
    return requests.get(f'{host}/daily_json.js', timeout=timeout).json()

In [10]:
exchange_rates('https://www.cbr-xml-daily.ru', timeout=0.001)

ConnectTimeout: HTTPSConnectionPool(host='www.cbr-xml-daily.ru', port=443): Max retries exceeded with url: /daily_json.js (Caused by ConnectTimeoutError(<urllib3.connection.VerifiedHTTPSConnection object at 0x10f974f60>, 'Connection to www.cbr-xml-daily.ru timed out. (connect timeout=0.001)'))

In [21]:
import time

N_RETRIES = 3

rates = None
for i in range(N_RETRIES):
    try:
        rates = exchange_rates('https://www.cbr-xml-daily.ru', timeout=0.001)
    except requests.Timeout as e:
        print(f'Серверу тяжело, попробуйте попозже. Жду {2**i}c')
        time.sleep(2**i)
        
if rates:
    print(rates)
else:
    raise ValueError('Иди чини сервер')

Серверу тяжело, попробуйте попозже. Жду 1c
Серверу тяжело, попробуйте попозже. Жду 2c
Серверу тяжело, попробуйте попозже. Жду 4c


ValueError: Иди чини сервер

In [None]:
rates = None
for i in range(N_RETRIES):
    try:
        if i >= 2:
            rates = exchange_rates('https://www.cbr-xml-daily.ru', timeout=1)
        else:
            rates = exchange_rates('https://www.cbr-xml-daily.ru', timeout=0.001)
            
    except requests.Timeout as e:
        print(f'Серверу тяжело, попробуйте попозже. Жду {2**i}c')
        time.sleep(2**i)
        rates = None
        
if rates:
    print(rates)
else:
    raise ValueError('Иди чини сервер')

# Обработка ошибок
1. Текст ошибки указывается в последней строчке
2. Все что перед ней - место, где ошибка произошла
3. Есть встроенные типы ошибок, но можно создавать и свои

Некоторые типы ошибок из документации (точнее [перевода](https://pythonworld.ru/tipy-dannyx-v-python/isklyucheniya-v-python-konstrukciya-try-except-dlya-obrabotki-isklyuchenij.html)):
- ZeroDivisionError - деление на ноль
- ImportError - не удалось импортирование модуля или его атрибута (надо установить эту библиотеку)
- IndexError - индекс не входит в диапазон элементов.
- KeyError - несуществующий ключ (в словаре, множестве или другом объекте)
- MemoryError - недостаточно памяти
- SyntaxError - синтаксическая ошибка (вы опечатались или не закрыли скобку)
- TypeError - операция применена к объекту несоответствующего типа
- ValueError - функция получает аргумент правильного типа, но некорректного значения
- Warning - предупреждение (текст на красном фоне в юпитере это предупреждение, а не ошибка)

In [None]:
# эту строку можно перевести в число
some_num = '123'

In [None]:
float(some_num)

In [None]:
# а эту уже нет (по крайней мере в десятичном счислении)
ups = '123a'

In [None]:
# ValueError - тип ошибки, далее пояснение что произошло
# ----> 1 float(ups) - в каком месте кода произошла ошибка
float(ups)

Пример ошибки внутри функции

In [9]:
def square_sum(*args):
    total_sum = 0
    for arg in args:
        total_sum += arg**2
    
    return total_sum

In [10]:
square_sum(1, 2, 3)

14

In [11]:
# пытаемся применить к операцию возведения в квадрат к строке
# ----> 1 square_sum(1, 2, '3') - в какой функции произошла ошибка
# ----> 4         total_sum += arg**2 - в какой именно строке произошла ошибка

square_sum(1, 2, '3')

TypeError: unsupported operand type(s) for ** or pow(): 'str' and 'int'

## Как сделать, чтобы цикл с расчетом не падал каждый раз

In [None]:
try:
    # ваш код, где может произойти ошибка
    float('123a')

except:
    # код, который выполняется в случае ошибки
    

In [13]:
float('90few')

ValueError: could not convert string to float: '90few'

In [17]:
data = ['90', '60', '90', '240tot']
total_sum = 0
x = 2

for num in data:
    try:
        total_sum += float(num)
    except:
        print('Ошибка в данных: {}'.format(num))
    
    
print('Итого', total_sum)

150.0


TypeError: unsupported operand type(s) for /: 'NoneType' and 'int'

Как сохранить всю информацию об ошибке?

In [None]:
# полная версия traceback
import traceback

try:
    float('123fff')

except Exception:
    print(traceback.print_exc())
    
print('Проехали')

### Блок finally

In [None]:
try:
    pass
except:
    pass
finally:
    pass

In [None]:
try:
    pass
except:
    pass

pass

In [None]:
connection = pymysql.connect(host, user, password)

In [22]:
try:
    print(1)
    1 / 0
    
except:
    print(2)
    1 / 0
    
finally:
    print('Эта строчка будет выполнена всегда')

1
2
Эта строчка будет выполнена всегда


ZeroDivisionError: division by zero

In [None]:
connection.close()

### Более жизненный пример

In [1]:
from datetime import datetime

In [10]:
DATE_FORMATS = ['%d.%m.%y %H:%M', '%d.%m.%YT %H:%M:%S', '123']

In [12]:
def make_date(datetime_):
    for format_ in DATE_FORMATS:
        try:
            return datetime.strptime(datetime_, format_)
        except:
            pass
        
    raise ValueError('Неизвестный формат даты')

In [5]:
datetime.strptime('09.10.2016T 21:40:00', '%d.%m.%YT %H:%M:%S')

datetime.datetime(2016, 10, 9, 21, 40)

In [14]:
10.87 + 20.57

31.439999999999998

In [18]:
int((10.87 + 1/3) * 10**6) //10**6

11

In [None]:
11.47

In [13]:
with open('real_data.txt', 'r') as f:
    for line in f:
        if len(line.strip().split('\t')) == 3:
            print(line)
            datetime_, user_id, revenue = line.strip().split('\t')
            datetime_ = make_date(datetime_)

05.10.16 23:18	1010	20,2

09.10.2016T 21:40:00	1036	15,6

01.10.16 4:57	1042	14,8

01.10.16 23:29	1042	14,4

03.10.16 20:20	1042	14

04.10.16 0:35	1042	20

04.10.16 13:46	1042	16,2

04.10.16 17:34	1042	11

05.10.16 15:15	1042	10800000

06.10.16 20:45	1042	22,6

07.10.16 2:54	1042	22,4

07.10.16 5:02	1042	24,4

07.10.16 6:35	1042	16,6

08.10.2016T 16:46:00	1042	8,6

07.10.16 9:59	1052	24

08.10.2016T 19:36:00	1052	18,8

09.10.2016T 16:27:00	1062	11,2

05.10.16 4:38	1067	19

04.10.16 9:56	1078	23,4

04.10.16 14:36	1085	17

05.10.16 16:41	1096	20,8

01.10.16 11:55	1098	15,6

07.10.16 9:06	1105	16,2

01.10.16 4:30	1108	17,8

01.10.16 18:16	1108	18,8

02.10.16 2:58	1108	20000000

02.10.16 6:01	1108	21

02.10.16 20:03	1108	16,6

04.10.16 2:56	1108	20

04.10.16 6:57	1108	19,8

06.10.16 6:46	1108	16,8

09.10.2016T 8:33:00	1108	24000000

08.10.2016T 8:02:00	1111	12

05.10.16 5:25	1112	10,2

09.10.2016T 0:03:00	1112	24

06.10.16 10:09	1113	15,8

09.10.2016T 12:09:00	1113	22

05.10.16 18:00	1114	

Чем прекрасен этот файл:
1. Даты имеют разный формат: за 8 и 9 октября формат с "09.10.2016 21:40" сменился на "09.10.2016T 21:40:00" (добавилась буква T и секунды). Разработчики объяснили этот тем, что сбились настройки после обновления одной из баз данных.
2. У покупок некоторых пользователей неизвестно значение выручки, из-за чего количество столбцов в строке уменьшается на один.
3. У некоторых строк реальная сумма покупки умножена на миллион. Так иногда действительно делают, чтобы избежать дробных чисел и работать только с целыми.

Необходимо посчитать сумму выручки из третьего столбца.

In [19]:
import requests

# Wifi

# Алгоритм экспоненциальной задержки

In [24]:
def exchange_rates(host, timeout):
    return requests.get(f'{host}/daily_json.js', timeout=timeout).json()

# Кратковременная ошибка
Wifi

# Серьезная ошибка
Недоступен сервис 99.9%

365 - 8 часов

In [30]:
import time

In [31]:
time.sleep(5)

In [36]:
2**10

1024

In [39]:
for i in range(5):
    try:
        data = exchange_rates('https://www.cbr-xml-daily.ru', 300)
    except:
        print('Неудачная попытка, жду секунд', 2**i)
        time.sleep(2**i)
        
print(data)

{'Date': '2021-03-20T11:30:00+03:00', 'PreviousDate': '2021-03-19T11:30:00+03:00', 'PreviousURL': '//www.cbr-xml-daily.ru/archive/2021/03/19/daily_json.js', 'Timestamp': '2021-03-19T20:00:00+03:00', 'Valute': {'AUD': {'ID': 'R01010', 'NumCode': '036', 'CharCode': 'AUD', 'Nominal': 1, 'Name': 'Австралийский доллар', 'Value': 57.5541, 'Previous': 57.6007}, 'AZN': {'ID': 'R01020A', 'NumCode': '944', 'CharCode': 'AZN', 'Nominal': 1, 'Name': 'Азербайджанский манат', 'Value': 43.6368, 'Previous': 43.3539}, 'GBP': {'ID': 'R01035', 'NumCode': '826', 'CharCode': 'GBP', 'Nominal': 1, 'Name': 'Фунт стерлингов Соединенного королевства', 'Value': 103.3424, 'Previous': 102.8858}, 'AMD': {'ID': 'R01060', 'NumCode': '051', 'CharCode': 'AMD', 'Nominal': 100, 'Name': 'Армянских драмов', 'Value': 14.0481, 'Previous': 13.957}, 'BYN': {'ID': 'R01090B', 'NumCode': '933', 'CharCode': 'BYN', 'Nominal': 1, 'Name': 'Белорусский рубль', 'Value': 28.5611, 'Previous': 28.3246}, 'BGN': {'ID': 'R01100', 'NumCode': '

In [23]:
for i in range(1000):
    try:
        requests.get('https://www.cbr-xml-daily.ru/daily_json.js').json()
    except:
        pass

{'Date': '2021-03-20T11:30:00+03:00',
 'PreviousDate': '2021-03-19T11:30:00+03:00',
 'PreviousURL': '//www.cbr-xml-daily.ru/archive/2021/03/19/daily_json.js',
 'Timestamp': '2021-03-19T20:00:00+03:00',
 'Valute': {'AUD': {'ID': 'R01010',
   'NumCode': '036',
   'CharCode': 'AUD',
   'Nominal': 1,
   'Name': 'Австралийский доллар',
   'Value': 57.5541,
   'Previous': 57.6007},
  'AZN': {'ID': 'R01020A',
   'NumCode': '944',
   'CharCode': 'AZN',
   'Nominal': 1,
   'Name': 'Азербайджанский манат',
   'Value': 43.6368,
   'Previous': 43.3539},
  'GBP': {'ID': 'R01035',
   'NumCode': '826',
   'CharCode': 'GBP',
   'Nominal': 1,
   'Name': 'Фунт стерлингов Соединенного королевства',
   'Value': 103.3424,
   'Previous': 102.8858},
  'AMD': {'ID': 'R01060',
   'NumCode': '051',
   'CharCode': 'AMD',
   'Nominal': 100,
   'Name': 'Армянских драмов',
   'Value': 14.0481,
   'Previous': 13.957},
  'BYN': {'ID': 'R01090B',
   'NumCode': '933',
   'CharCode': 'BYN',
   'Nominal': 1,
   'Name': '

# Даты

In [None]:
# иногда импортируют так
import datetime

In [None]:
# можно и так
import datetime as dt

In [None]:
# у нас будет вариант покороче (но это не одно и то же)
from datetime import datetime

In [None]:
date_string = '09.05.2018  09:00'

In [None]:
# сейчас date_string это просто строка
type(date_string)

In [None]:
datetime.strptime('09.05.2018 09:00', '%d.%m.%Y %H:%M')

In [None]:
# https://docs.python.org/3/library/datetime.html

date_datetime = datetime.strptime( date_string, '%d.%m.%Y %H:%M' )
date_datetime

In [None]:
# теперь можем работать с датами
type(date_datetime)

In [None]:
# получить номер года и часа
date_datetime.year, date_datetime.hour

In [None]:
# день недели
date_datetime.weekday()

In [None]:
# сегодня
datetime.now()

### Упражнение
С помощью метода datetime.strptime переведите строку 'May 25 2017 5:00AM' в формат datetime.

### Прибавление интервала к датам

In [None]:
from datetime import timedelta

In [None]:
start_date = '2018-01-01'
end_date = '2018-01-07'

In [None]:
type(start_date)

In [None]:
start_date_datetime = datetime.strptime(start_date, '%Y-%m-%d')
start_date_datetime

In [None]:
start_date_datetime + timedelta(days=1)

In [None]:
start_date_datetime + timedelta(days=-7, minutes=-1)

### Перевод обратно в строку

In [None]:
date = datetime(2018, 9, 1)
date

In [None]:
date.strftime('%Y-%m-%d')

In [None]:
date.strftime('%B %d %Y %I:%M%p')

In [None]:
datetime.now().strftime('%Y-%m-01')

In [None]:
# как получить первый день месяца

date.strftime('%Y-%m-01')

In [None]:
start_date = '2018-01-01'
end_date = '2018-01-07'

In [None]:
start_date, end_date

In [None]:
start_date_dt = datetime.strptime(start_date, '%Y-%m-%d')
end_date_dt = datetime.strptime(end_date, '%Y-%m-%d')

print(start_date_dt, end_date_dt)

In [None]:
i = 0

while i < 10:
    # ...
    i += 1
    print(i)

In [None]:
current_dt = start_date_dt

while current_dt <= end_date_dt:
    print(current_dt.strftime('%Y-%m-%d'))
    
    current_dt += timedelta(days=1)

In [None]:
current_dt = start_date_dt

while current_dt.strftime('%Y-%m-%d') <= end_date:
    print(current_dt.strftime('%Y-%m-%d'))
    
    current_dt += timedelta(days=1)

In [None]:
# можно и с помощью list comprehension
[(start_date_dt + timedelta(days=x)).strftime('%Y-%m-%d') for x in range(10)]

### Нагрузка на систему по часам

In [None]:
stats = {}

with open('logs.csv', 'r') as f:
    for line in f:
        line = line.strip()
        print(line)
        
        break
        
        # вычисления нагрузки на систему...
        
# результат
stats

In [None]:
# а в процентном соотношении?


###  Unixtime
Количество секунд, прошедших с 1 января 1970 года по UTC

In [None]:
import time
from datetime import date
from datetime import datetime

In [None]:
d = date(2019, 3, 11)

unixtime = time.mktime(d.timetuple())
unixtime

In [None]:
from datetime import datetime

In [None]:
datetime.fromtimestamp(1552251600)

На практике все сложнее https://habr.com/ru/post/452584/

# Задача про интервалы
Имеется список отсортированных по возрастанию целых чисел data. А также целое число n, которое лежит между минимальным и максимальным значениями из списка data. Вам необходимо определить минимальное ближайшее число к n из списка data.

Пример:
```python
data = [1, 7, 17, 23, 27, 35, 65]
n = 20
```

Ответ: 17

Подобные алгоритмы используются для классификации объекта по значению одной метрики. Например, это может пригодиться для классификации учащегося по его возрасту:
```python
ages = {
    1: 'дети',
    7: 'школьники',
    17: 'студенты',
    23: 'аспиранты',
    27: 'молодые ученые',
    35: 'преподаватели',
    65: 'пенсионеры',
}
```

Итого напишите функцию, которая по списку data и числу n возвращает минимальное ближайшее к n число. Список может быть любым, поэтому не рассчитывайте на написание цепочки условий через if.

Бонусные варианты:
1. Рассмотрите ситуацию, в которой при фиксированном списке data вам необходимо классифицировать большое количество пользователей с разными значениями n. Например, вам необходимо классифицировать базу из 100 миллионов человек по возрастам по словарю ages из примера выше. Можно ли в таком случае ускорить проход по такому числу пользователей?

2. Если вы решали основное задание перебором элементов списка data и сравнением с n, то сложность такого алгоритма O(N). Т. е. при увеличении числа элементов списка data в N раз время работы алгоритма тоже вырастет в N раз. Попробуйте ускорить этот алгоритм. Например, с помощью аналога бинарного поиска.