# Алгоритмы поиска в массиве

## Введение

**Определение:** Задача поиска в массиве (Search in array problem)
Вход: Число $k$ и массив из $n$ чисел $\langle a_1, ..., a_n \rangle$
Выход: Позиция $i$ элемента $k$ в массиве $A$, либо $-1$, если $k$ в $A$ нет

**Правосторонний поиск:** Поиск при котором если $\exists i > j : A_i = A_j = k$, то ответом будет индекс $i$ (наибольший)

**Левосторонний поиск:** Поиск при котором если $\exists i > j : A_i = A_j = k$, то ответом будет индекс $j$ (наименьший)

## Бинарный поиск

Пусть массив $A$ отсортирован

**Идея:** Приходим в элемент посередине, смотрим, больше он, чем искомый или меньше, в зависимости от этого переходим в левых/правый подмассив


In [2]:
def binsearch_left(A, key):
    l = -1
    r = len(A)
    while r - l > 1:
        m = (l + r) // 2
        if A[m] < key:
            l = m
        else:
            r = m
    return r if r != len(A) else -1

A = [1, 2, 3, 4, 4, 5, 6, 7, 8, 9, 10]
binsearch_left(A, 4)

3

**Теорема**
binsearch_left выполняет задачу поиска на отсортированном массиве A
$\square$
Случай 1: $key \in (A_l, A_r]$
Инвариант: $key \in (A_l, A_r]$
Инициализация: $key \in (A_{l_1}, A_{r_1}]$
Сохранение: В предположении индукции $key \in (A_{l_k}, A_{r_k}]$. Тогда если
$A_{\lfloor \frac{l_k + r_k}{2} \rfloor} < key$, то $l_{k + 1} = \lfloor \frac{l_k + r_k}{2} \rfloor$, в обратном случае $r_{k + 1} = \lfloor \frac{l_k + r_k}{2} \rfloor$, т.о. $key \in (A_{l_{k + 1}}, A_{r_{k + 1}}]$
Завершение: в момент, когда возрастающая последовательность $l_k$ и убывающая последовательность $r_k$ встретятся в точке $k'$, останется один элемент $A_{r_{k'}}$, который либо равен $key$ и тогда binsearch_left вернет $r_{k'}$, либо не равен и тогда binsearch_left вернет $-1$

Случай 2: $key \notin (A_l, A_r]$
Думаю, ситуация в этом случае очевидна, $l_k$ будет возрастать, пока не встретится с $r_k$, которая меняться не будет. Так как $key \notin (A_l, A_r]$, binsearch_left вернет $-1$
$\blacksquare$

**Теорема**
binsearch_left имеет асимптотику $\theta(\log(n))$
$\square$
$T(n) = T(n / 2) + 1$, т.о.
$T(n) = \Theta(\log(n))$
$\blacksquare$

Аналогично можно ввести правосторонний бинпоиск

In [3]:
def binsearch_right(A, key):
    l = -1
    r = len(A)
    while r - l > 1:
        m = (l + r) // 2
        if A[m] <= key:
            l = m
        else:
            r = m
    return l

A = [1, 2, 3, 4, 4, 5, 6, 7, 8, 9, 10]
binsearch_right(A, 4)

4

**Замечание:** Бинарный поиск можно использовать на любой монотонной функции, в том числе и вещественной

**Замечание:** Если задачу можно переформулировать в виде "найдите максимальное $X$, такое что какое-то свойство от X выполняется", то ее можно решать с помощью бинпоиска. Такой метод называется бинарный поиск по ответу