### Бинарный поиск.

#### Основная идея.

Допустим, у нас есть массив элементов и некоторая функция, которая по элементу возвращает либо $True$, либо $False$. Наложим на эту функцию условие - пусть сначала для всех элементов она возвращает $True$, а потом, начиная с какой-то позиции, возвращает только $False$. Такие функции называются монотонными, мы хотим работать с монотонной функцией. Проверим любой элемент, спросив значение функции от него. Если это $True$, то мы знаем, что все элементы левее него тоже будут давать такое значение. Аналогично с $False$, только мы получим информацию про элементы, которые правее нас.

Мы хотим найти позицию, где заканчивается $True$ и начинается $False$. Заведем границы поиска - два указателя $left$ и $right$. Будем поддерживать следующий инвариант: точка перехода лежит где-то на отрезке $[left, right]$, значение в $left$ всегда $True$, а в $right$ всегда $False$. Будем проверять значение в середине текущего отрезка $middle$ и сдвигать одну из границ поиска.

Если $F(middle)=False$, то сдвинем правую границу: $right=middle$. Иначе сдвинем левую $left=middle$. Заметим, что инвариант при этом продолжает выполняться.

#### Выбор границ бинарного поиска.


Что делать, если функцию всегда истинна или всегда ложна на данном массиве? Нам необходимо поддерживать описанный выше инвариант. Будем считать, что в массиве есть фиктивные элементы перед самым первым элементом и после последнего элемента и скажем, что $F(-1)=True$, $F(n)=False$. Границы поиска изначально будут равны $left=-1$, $right=n$ (нумерация с нуля).

Перейдем от общих слов к примерам.



### Задачи


####  1. Поиск первой единицы в массиве.

У нас есть массив, состоящий из некоторого количества подряд идущих нулей, за которыми следует какое-то количество подряд идущих единиц. Вам нужно найти позицию первой единицы, то есть найти такое место, где заканчиваются нули, и начинаются единицы. Это можно сделать с помощью линейного поиска за один проход по массиву, но хочется сделать это быстрее с помощью бинарного поиска. Посмотрим на элемент посередине массива. Если это нуль, то первую единицу стоит искать в правой половине массива, а если единица - то в левой. Решение этой задачи выглядит примерно так:

In [1]:
a = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1]
n = len(a)


In [2]:
def bin_search(l, r):
    left = l
    right = r
    while right - left > 1:
        middle = (left + right) // 2        # формула среднего индекса
        if a[middle] == 1:
            right = middle                  # right будет указывать на 1
        else:
            left = middle                   # left будет указывать на 0
    return right
 

In [3]:
print(bin_search(-1, n))

10


#### 2. Поиск элемента в отсортированном массиве.

Ведущий загадал число $X$ от 1 до $100$. Вы можете спросить, больше ли мое число чем число $T$, ведущий отвечает "да" или "нет". За сколько вопросов в худшем случае вы сможете найти число $X$? Как нужно действовать?

Для решения используем ту же идею. В самом начале мы говорили о некоторой логической функции $F$, тут она определена достаточно четко.

$F(a) = \begin{cases}
 True \text{ , } a \leq x \\ 
 False \text{ , } a > x 
\end{cases}$

По сути код предыдущего решения отличается лишь строкой 5, где вместо проверки $a[middle] == 1$ будет стоять $a[middle] >= x$.

В конце программы указатель $left$ будет стоять на последнем элементе, который меньше $X$, а $right$ - на первом элементе, который больше или равен $X$. Тогда проверим элемент $right$. Если он равен $X$, то $X$ есть в массиве, иначе - нет.



In [27]:
def bin_search2(x):
    left = -1
    right = 100
    while right - left > 1:
        middle = (left + right) // 2        
        if a[middle] > x:
            right = middle                  
        else:
            left = middle 
    
    if a[left] == x:
        return True
    return False
    

In [28]:
a = [i for i in range(1, 101)]
print(a)
print(bin_search2(int(input())))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100]
0
False


#### Асимптотика:
Почему нужно делить обязательно пополам? Почему бы не спросить "число X больше, чем 80?" первым же вопросом? Но если вдруг ответ "нет", то мы останемся с 80 вариантами вместо 100. То есть деление отрезка ровно пополам гарантирует, что в худшем случае мы останемся не более чем с половиной вариантов.

Так как отрезок поиска каждый раз уменьшается в два раза, то цикл while выполнится $O(log(n))$ раз, где $log(n)$ - логарифм числа $n$ по основанию 2.

