Рекурсивный алгоритм бинарного поиска
В этом разделе вы узнаете о простом алгоритме, который обязан знать любой специалист по computer science: алгоритме бинарного поиска. У бинарного поиска есть множество важных приложений во многих реализациях простых структур данных: множеств, деревьев, ассоциативных массивов, хешированных множеств, хешированных таблиц, хеш-карт и массивов. Эти структуры данных используются в любой нетривиальной программе.
Общее описание
Если коротко, алгоритм бинарного поиска (binary search algorithm) производит в отсортированной последовательности l поиск конкретного значения x путем многократного сокращения размера этой последовательности вдвое, до тех пор, пока не останется только одно значение. Либо это будет искомое значение, либо его вообще не было в последовательности. Далее мы рассмотрим эту общую идею подробнее.
Например, представьте, что нужно найти в отсортированной последовательности значение 56. При «наивном» алгоритме мы бы начали с первого
Рекурсивный алгоритм бинарного поиска 243
элемента списка, проверили, не равен ли он 56, и перешли к следующему, и так до тех пор, пока не проверили бы все элементы или нашли искомое значение. В наихудшем случае алгоритм проверяет все элементы списка. Отсортированный список из 10 000 значений требует примерно 10 000 операций для проверки всех элементов списка на равенство искомому значению. На языке теории алгоритмов можно сказать, что сложность вычисления линейна относительно количества элементов списка. Алгоритм не использует всю доступную информацию, чтобы добиться максимальной эффективности.
Первая часть полезной информации — то, что список отсортирован! С помощью этого факта можно создать алгоритм, которому, чтобы абсолютно точно выяснить, присутствует ли в списке искомый элемент, достаточно проверить лишь несколько элементов списка. Алгоритм бинарного поиска обходит лишь log2(n) элементов (логарифм по основанию 2). Для поиска в том же списке из 10 000 элементов достаточно всего лишь log2(10 000) < 14 операций.
При бинарном поиске предполагается, что список отсортирован в порядке возрастания. Алгоритм проверяет сначала элемент в середине списка. Если это срединное значение больше искомого, значит, все значения от середины и до последнего элемента списка больше требуемого. Искомое значение не входит в эту половину списка, так что одной операции достаточно, чтобы сразу отбросить половину элементов.
Аналогично, если искомое значение больше срединного, то можно отбросить первую половину элементов списка. А затем эта процедура сокращения вдвое фактического размера списка проверяемых элементов повторяется на каждом шаге алгоритма.

Нам нужно найти значение 56 в отсортированном списке из восьми целочисленных значений, просмотрев при этом как можно меньше элементов. Алгоритм бинарного поиска проверяет расположенный посередине (с учетом округления) элемент x и отбрасывает половину списка, в которой 56 заведомо не может быть. У этой проверки могут быть три исхода:
элемент x больше 56. Алгоритм игнорирует правую часть списка;
элемент x меньше значения 56. Алгоритм игнорирует левую часть списка;
элемент x равен 56, как на последней строке Поздравляем — мы нашли искомое значение!
показана реализация алгоритма бинарного поиска.

In [3]:
l = [3, 6, 14, 16, 33, 55, 56, 89]
x = 33

bs = lambda l, x, lo, hi: -1 if lo > hi else\
    (lo+hi)//2 if l[(lo+hi)//2-1] == x else\
    bs(l, x, lo, (lo+hi)//2-1) if l[(lo+hi)//2] > x else\
    bs(l, x, (lo+hi)//2+1, hi)

print(bs(l, x, 0, len(l)-1))

5
5


Принцип работы
Благодаря тому, что бинарный поиск естественным образом подходит для реализации рекурсивного подхода, изучение данного однострочника укрепит ваше понимание этого важного понятия теории computer science. Отмечу, что я разбил данное однострочное решение на четыре строки ради удобства чтения, хотя, конечно, вы можете записать его в одной строке кода. В данном однострочнике используется рекурсивный способ реализации алгоритма бинарного поиска.
Мы создаем новую функцию bs с помощью оператора lambda с четырьмя аргументами: l, x, lo и hi . Первые два аргумента l и x представляют собой переменные, содержащие отсортированный список и значение для поиска. Аргументы lo и hi задают минимальный и максимальный индекс текущего подсписка, в котором производится поиск значения x. На каждом уровне рекурсии код проверяет подсписок, заданный индексами lo и hi, все уменьшающийся по мере увеличения индекса lo и уменьшения индекса hi. После конечного количества шагов условие lo>hi становится
246 Глава 6. Алгоритмы
True. Просматриваемый подсписок пуст — и мы не нашли значение x. Это граничный случай нашей рекурсии. Поскольку мы не нашли элемент x, то возвращаем –1, указывая, что искомого элемента не существует.
Для поиска срединного элемента подсписка мы прибегнем к формуле (lo+hi)//2. Если он оказывается искомым, то возвращаем его индекс . Обратите внимание, что здесь используется целочисленное деление для округления вниз к ближайшему целочисленному значению, которое можно применять в качестве индекса списка.
Если срединный элемент больше желаемого значения, значит, все элементы справа тоже больше него, поэтому можно произвести рекурсивный вызов функции, но изменить индекс hi так, чтобы далее анализировать только элементы списка слева от срединного элемента .
Аналогично, если срединный элемент меньше желаемого значения, то можно не просматривать элементы слева от него, поэтому можно произвести рекурсивный вызов функции, но изменить индекс lo так, чтобы далее анализировать только элементы списка справа от срединного элемента .
Поиск значения 33 в списке [3, 6, 14, 16, 33, 55, 56, 89] возвращает индекс 4.
Материал этого раздела должен укрепить ваше общее понимание кода в том, что касается условного выполнения, основных ключевых слов и арифметических операций, а также важного вопроса доступа по индексу к последовательностям программным образом. Но что еще важнее, вы узнали, как упрощать решение сложных задач с помощью рекурсии.