#Линейный и бинарный поиск 

Представим, что у вас есть доступ к данным отдела обслуживания клиентов. Вы можете посмотреть все id договоров, которые они обработали за день, отсортированные в порядке возрастания. (ID – это уникальный идентификатор договора, в нашем случае пусть это будет целое положительное число). 


In [1]:
input_data = [58, 90, 93, 94, 100, 111, 123, 2345, 2600]

Вашего коллегу-аналитика заинтересовал договор с номером 111, и он просит вас посмотреть, был ли обработан этот договор сегодня. Для вас задача по факту сводится к тому, чтобы загрузить все id договоров в список и проверить, есть ли там договор с номером 111.

Попробуем решить задачу “в лоб”. Возьмём все элементы списка и для каждого будем проверять, является ли он 111 договором. Сама программа будет выглядеть вот так:

In [2]:
found = False

for i in range(0, len(input_data)):
    if input_data[i] == 111:
        found = True
        break
        
print(found)

True


Разберём алгоритм:
1. Создаём переменную `found`, которая будет хранить в себе булево значение, найден ли нужный элемент. Изначально туда кладем `False`, так как еще ничего не нашли.
2. Заводим цикл по всем элементам списка 
3. В теле цикла сравниваем элемент списка с числом 111
4. Если они совпали, значит элемент найден, в `found` кладем значение `True` и выходим из цикла, так как больше ничего искать не нужно
5. Если значения не совпали, мы ничего не делаем и переходим к следующей итерации цикла. Если в списке не будет ни одного элемента 111, то `found` никогда не поменяется и останется со значением `False`


Этот алгоритм называется ***линейным поиском***. Такая реализация совсем неоптимальная: если у нас будет 111 договоров, в худшем случае нам придется совершить 111 сравнений, чтобы найти искомый договор. 

Конечно же есть алгоритм, который может ответить на вопрос, есть ли число в списке, быстрее, чем за 111 проходов. Он называется ***бинарный поиск***. 



Основная идея такова: на каждой итерации алгоритма мы делим список пополам, находим значение, которое оказалось в середине, сравниваем его с искомым значением (111). Если серединное значение не 111, нам нужно искать дальше. Производим аналогичные действия слева или справа от серединного значения. Так  происходит до тех пор пока искомое значение не будет найдено, либо элементы не закончатся.

Рассмотрим более детально на примере списка `input_data`.

**Первая итерация:** 

Работаем с исходным списком. В нем всего 9 элементов.

`input_data = [58, 90, 93, 94, 100, 111, 123, 2345, 2600]`

Заведем обозначения для начала и конца списка, с которым мы работаем. `B`(begin) – начало списка, `E`(end) – конец списка. В нашем случае `B=0, E=8`

Середина этого списка – число 100 с индексом 4. Назовем его `mid`. 

100 != 111, элемент не найден, значит нам нужно продолжать искать. 

100 < 111. Поскольку список уже отсортирован по возрастанию, это значит, нам нужно продолжать искать в правой части списка, левая для нас больше нерелевантна – отрезаем ее.

**Вторая итерация.**

Работаем с новым списком с индекса `B=5` до `E=8` – это все элементы, которые находятся справа от числа 100, их 4 штуки. 

Найдем серединный элемент. Их два: 123 и 2345. Нам по факту без разницы, какой из них взять в качестве середины. Пусть нашим новым `mid` будет 123, элемент с индексом 6. 

123 != 111, значит нужно продолжать искать. 

111 < 123, значит нам нужно всё, что слева от `mid`

**Третья итерация.** 

`B=5, E=5`. В новом списке всего один элемент, следовательно, он и есть середина. 

Сравниваем `mid` и 111. Они совпали, элемент найден, прерываем наши поиски.

Если бы на этом этапе элементы не совпали, мы бы также закончили наши поиски, так как элементов больше не осталось.



В рамках данного поиска мы оперировали следующими переменными: 
- `B`, `E` – начало и конец списка, в котором ищем целевое значение
- `mid` – серединное значение в списке с координатами от `B` до `E`
- `key` – значение, которое мы ищем, в нашем случае 111


Теперь попробуйте самостоятельно запрограммировать бинарный поиск с помощью цикла и переменных, которые мы объявили выше. Попробуйте подавать на вход различные списки и  целевые значения и проверьте, что алгоритм отрабатывает верно.

In [17]:
b = 0
e = len(input_data)
key = 111
mid = e // 2
lst = input_data[b:e]
for i in range(e):
    print(i," - ", "; b =", b, "; e =", e, "; mid =", mid, lst)
    if lst[mid] == key:
        print("Ура нашли",  lst[mid])
        break
    else:
        if lst[mid] < key:
            b = mid
            lst = lst[b:]
            mid = len(lst) // 2
            e = len(lst)
        else:
            e = mid
            lst = lst[:e]
            mid = e // 2

0  -  ; b = 0 ; e = 9 ; mid = 4 [58, 90, 93, 94, 100, 111, 123, 2345, 2600]
1  -  ; b = 4 ; e = 5 ; mid = 2 [100, 111, 123, 2345, 2600]
2  -  ; b = 4 ; e = 2 ; mid = 1 [100, 111]
Ура нашли 1 111


Итак, мы рассмотрели два способа решить задачу: с помощью линейного и бинарного поиска. Давайте подумаем, какой же алгоритм лучше?


В случае линейного поиска нам нужно было бы проверить все элементы до 111 включительно, а это целых 6 элементов! 

В случае бинарного поиска мы проверили всего 3 элемента и уже пришли к результату. 6 против 3 и бинарный поиск выигрывает с преимуществом в три очка! 

Бинарный оказался быстрее, но он работает только на отсортированных списках. В следующем уроке мы познакомимся с алгоритмами, которые решают эту проблему.