# Рекурсия

Рекурсивная функция – это функция, которая вызывает сама себя, и при каждом очередном вызове использует данные, созданные во время предыдущего вызова. В программировании есть ряд задач, которые проще (но не всегда эффективнее) решаются с помощью рекурсии.

Стек – это структура данных LIFO (last in, first out): информация последовательно добавляется в «стопку» , каждый новый объект помещается поверх предыдущего, а извлекаются объекты в обратном порядке, – начиная с верхнего. Работу стека отлично иллюстрирует добавление данных в список с помощью append и извлечение информации посредством pop:

In [2]:
stack = []
for i in range(1, 4):
    stack.append(f'{i}-й элемент')
    print(f'+ {i}-й элемент добавлен')
    for i in stack:
        print(i, end=" ")
print('\n')    
for i in range(len(stack)):
    print('В стеке: ', end=" ")
    for i in stack:
        print(i, end=" ")
    print(f'\n{stack.pop()} удален из стека')

+ 1-й элемент добавлен
1-й элемент + 2-й элемент добавлен
1-й элемент 2-й элемент + 3-й элемент добавлен
1-й элемент 2-й элемент 3-й элемент 

В стеке:  1-й элемент 2-й элемент 3-й элемент 
3-й элемент удален из стека
В стеке:  1-й элемент 2-й элемент 
2-й элемент удален из стека
В стеке:  1-й элемент 
1-й элемент удален из стека


Стек вызовов, в свою очередь, – это область памяти, в которой выполняются функции. При каждом вызове функции создается фрейм – фрагмент памяти, – в котором содержится:

* информация о текущем состоянии выполнения функции;
* значения всех переменных, которые функция получила для обработки;
* локальные данные, созданные во время очередного вызова;
* сведения о строке программы, к которой нужно вернуться после выполнения функции.


Фреймы помещаются в стек вызовов, как уже было показано в примере выше, и удаляются точно так же, сверху вниз. Рекурсивные функции при каждом новом вызове используют данные, созданные во время работы предыдущего вызова.

Программисту не нужно беспокоиться о работе стека вызовов – созданием фреймов и управлением стеком занимается интерпретатор. Однако понимание принципа работы стека вызовов значительно упрощает создание рекурсивных функций.

Интерпретатор Python автоматически отслеживает переполнение стека и после 1000(в разных версиях языка может чуть отличаться) бесплодных вызовов завершает работу подобных функций с ошибкой:

In [3]:
def recursive():
    recursive()

recursive()

RecursionError: maximum recursion depth exceeded

Чтобы стек вызовов не переполнялся, в каждой рекурсивной функции всегда должны быть предусмотрены два случая:

* Граничный, при котором функция завершает работу и возвращает данные в основную программу.
* Рекурсивный, при котором функция продолжает вызывать себя.

Вот пример простейшей рекурсивной функции, в которой учтены оба случая:

In [4]:
def greetings(st):
    print(st)
    if len(st) == 0:  # Граничный случай
        return             
    else:       # Рекурсивный случай
        greetings(st[:-1])   

greetings('Hello, world!')

Hello, world!
Hello, world
Hello, worl
Hello, wor
Hello, wo
Hello, w
Hello, 
Hello,
Hello
Hell
Hel
He
H



Эту же функцию можно переписать так, чтобы одно и то же условие проверяло и граничный, и рекурсивный случаи сразу:

In [5]:
def greetings(st):
    print(st)
    if len(st) > 0:  
        greetings(st[:-1])   

greetings('Hello world!')

Hello world!
Hello world
Hello worl
Hello wor
Hello wo
Hello w
Hello 
Hello
Hell
Hel
He
H



Рекурсивные функции работают медленнее обычных, поэтому их стоит применять только тогда, когда решить задачу без рекурсии сложно. Вот сравнение времени выполнения двух функций, рекурсивной fib_recursive(n) и обычной fib_iter(n), решающих одну и ту же задачу – вычисление последовательности Фибоначчи:

In [6]:
from timeit import timeit

def fib_iter(n):
    if n == 1:
        return [1]
    if n == 2:
        return [1, 1]
    fibs = [1, 1]
    for _ in range(2, n):
        fibs.append(fibs[-1] + fibs[-2])
    return fibs

setup_code_iter = 'from __main__ import fib_iter'
stmt_iter = 'fib_iter(15)'
print('Время выполнения итеративной функции: ', timeit(setup=setup_code_iter, stmt=stmt_iter, number=20000))

Время выполнения итеративной функции:  0.037388208002084866


In [7]:
def fib_recursive(n):
    if(n <= 1):
        return n
    else:
        return(fib_recursive(n-1) + fib_recursive(n-2))
    
setup_code_rec = 'from __main__ import fib_recursive'
stmt_rec = 'fib_recursive(15)'
print('Время выполнения рекурсивной функции: ', timeit(setup=setup_code_rec, stmt=stmt_rec, number=20000))

Время выполнения рекурсивной функции:  2.568575083001633


В приведенном выше примере в обычной функции используется цикл for. Цикл выполняет итерацию (перебор), причем справляется с задачей гораздо быстрее, чем рекурсивная функция, поскольку рекурсия совершает множество повторных вызовов, и с увеличением числа элементов последовательности количество повторов растет лавинообразно

Итерацию можно назвать противоположностью рекурсии. Всегда, когда задачу можно решить итерацией (либо итерацией с использованием стека), следует делать выбор в пользу цикла for или while вместо рекурсии.

### Оптимизация Рекурсивных Функций

Если применение рекурсии при решении задачи неизбежно, есть простой способ ускорить выполнение функции – для этого используют декоратор @lru_cache() модуля functools. Сравним скорость выполнения рекурсивного кода при решении следующей олимпиадной задачи.

Задача: лесенка представляет собой набор кубиков. В этом наборе каждый последующий ряд состоит из меньшего числа кубиков, чем предыдущий. Надо написать программу для вычисления количества лесенок, которое можно построить из n кубиков.

В решении используется рекурсивная функция, выполнение которой в интерпретаторе Python занимает столько времени, что готовое решение никогда не будет соответствовать строгим олимпиадным критериям. Для кэширования промежуточных результатов можно написать функцию мемоизации самостоятельно, а можно воспользоваться готовым, уже упомянутым выше декоратором. Сравним скорость выполнения решений с мемоизацией и без:

In [8]:
def kol_les_no_mem(n, k):
    if n == 0:
        return 1
    ans = 0
      
    for i in range(k + 1, n + 1):
        ans += kol_les_no_mem(n - i,  i)
    return ans

setup_code_no_mem = 'from __main__ import kol_les_no_mem'
stmt_no_mem = 'kol_les_no_mem(25, 0)'
print('Время выполнения без мемоизации: ', timeit(setup=setup_code_no_mem, stmt=stmt_no_mem, number=20000))

Время выполнения без мемоизации:  2.7636508750147186


In [10]:
setup_code_mem = '''
import functools
@functools.lru_cache(maxsize=None)

def kol_les_mem(n, k):
    if n == 0:
        return 1
    ans = 0
      
    for i in range(k + 1, n + 1):
        ans += kol_les_mem(n - i,  i)
    return ans
'''

stmt_mem = 'kol_les_mem(25, 0)'
print('Время выполнения с мемоизацией: ', timeit(setup=setup_code_mem, stmt=stmt_mem, number=20000))

Время выполнения с мемоизацией:  0.005185166985029355


Динамическое программирование (ДП) — это метод решения сложных задач путём разбиения их на более мелкие подзадачи, решение которых легче и проще. Основная идея ДП заключается в том, чтобы не решать одну и ту же подзадачу многократно, а сохранять результаты решения подзадач и повторно использовать их для ускорения общего процесса решения.

Динамическое программирование часто применяется в задачах, где есть повторяющиеся вычисления и в задачах оптимизации. Оно особенно полезно, когда количество возможных путей решения задачи экспоненциально велико.

Ключевые элементы ДП:

* Перекрывающиеся подзадачи: Задача должна включать подзадачи, которые повторяются несколько раз.
* Оптимальная подструктура: Решение исходной задачи должно эффективно составляться из оптимальных решений её подзадач.

Динамическое программирование vs Рекурсия: Отличие динамического программирования от рекурсии заключается в том, что рекурсия включает вызов функции самой себя для решения более мелких задач. Динамическое программирование также использует рекурсию, однако его ключевой особенностью является сохранение результатов подзадач с целью предотвращения повторных вычислений.

Python предлагает несколько уникальных особенностей, делающих его идеальным языком для реализации динамического программирования:

* Читаемость и простота: Python известен своим чистым и легко читаемым синтаксисом, что упрощает написание и понимание алгоритмов.
* Встроенные структуры данных: Python предоставляет различные структуры данных, такие как списки (list), словари (dict), и множества (set), которые упрощают хранение и доступ к решениям подзадач.
* Поддержка рекурсии: Python поддерживает рекурсивные функции, что позволяет легко реализовывать рекурсивные алгоритмы динамического программирования.
* Декораторы: Python предоставляет декораторы, такие как @lru_cache из модуля functools, который автоматизирует процесс мемоизации, за счет кэширования результатов предыдущих вызовов функций.

#### Пример - самая длинная общая подпоследовательность 
Самая длинная общая подпоследовательность (LCS) означает, что вам будут предоставлены две строки/шаблоны/последовательности объектов. Среди этих двух последовательностей/строк вам необходимо найти самую длинную подпоследовательность элементов в том же порядке, присутствующих как в строках, так и в шаблонах.

In [14]:
template1 = "RGBGARGA"
template2 = "BGRAPG"

Из шаблона 1 можно создавать последовательности типа «RGB», «RGGA», «RGAR». Для создания последовательности вам необходимо поддерживать относительное положение каждого символа в строке.

Из шаблона 2 мы можем создавать такие последовательности, как «BGR», «BRAG», «RARG». Последовательности могут создаваться при условии, что они сохраняют относительное положение исходной строки.

Например, «BRG» является допустимой последовательностью, поскольку в исходной строке «pattern_2» сначала появляется «B», затем «R», а затем «G». Однако если последовательность имеет вид «RBRG», она недействительна. Потому что в исходной строке (шаблон_2) первой стоит «B».

У нас есть два варианта найти самую длинную общую подпоследовательность из данных двух последовательностей или массивов.

* Наивный метод
* Решение для динамического программирования: самая длинная общая подпоследовательность также известна как LCS.

In [16]:
#наивный подход
def lcs(pattern_1, pattern_2, len_1, len_2):
    if len_1 == 0 or len_2 == 0:
        return 0
    if pattern_1[len_1 - 1] == pattern_2[len_2 - 1]:
        return 1 + lcs(pattern_1, pattern_2, len_1 - 1, len_2 - 1)
    else :
        return max(lcs(pattern_1, pattern_2, len_1 - 1, len_2), lcs(pattern_1, pattern_2, len_1, len_2 - 1))
pattern_1 = "RGBGARGA"
pattern_2 = "BGRARG"
print("Lenght of LCS is: ", lcs(pattern_1, pattern_2, len(pattern_1), len(pattern_2)))

Lenght of LCS is:  5


Динамическое программирование означает оптимизацию простого рекурсивного метода.
Метод динамического программирования записывает все вычисления в массив и использует его при необходимости.

Мы будем использовать двумерный массив размером mxn, где m и n — длины шаблона2 и шаблона1.

Шаг 1) Если i или j равно нулю, мы берем пустую строку из данных двух строк и пытаемся найти общие подпоследовательности. Однако, поскольку подстрока, которую мы берем, пуста, длина подпоследовательности равна 0.

Шаг 2) Если два символа совпадают, мы присваиваем значение индексу (i,j), увеличивая ранее вычисленную LCS, которая присутствует в индексе (i-1,j-1) (из предыдущей строки).

Шаг 3) Если оно не совпадает, мы возьмем максимальную LCS двух соседних индексов. И таким образом нам нужно заполнить все значения в 2D-массиве.

Шаг 4) Наконец, мы вернем значение последней ячейки двумерного массива.

По сути, все значения в двумерном массиве содержат длину общих подпоследовательностей. Среди них последняя ячейка содержит длину самой длинной общей подпоследовательности.

In [21]:
def lcs(pattern_1, pattern_2):
    m = len(pattern_1)
    n = len(pattern_2)

    dp = [[None] * (n + 1) for item in range(m + 1)]
    for i in range(m + 1):
        for j in range(n + 1):
            if i == 0 or j == 0:
                dp[i][j] = 0
            elif pattern_1[i - 1] == pattern_2[j - 1]:
                dp[i][j] = dp[i - 1][j - 1] + 1
            else :
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
    return dp[m][n]
pattern_1 = "RGBGARGA"
pattern_2 = "BGRARG"
print("Length of LCS: ", lcs(pattern_1, pattern_2))


Length of LCS:  5


В двух словах, мы просто вычисляем каждую задачу один раз в методе DP. В рекурсивном методе у нас могут возникнуть перекрывающиеся подзадачи.

Рекурсию стоит применять для решения задач, в которых:

* Используется древовидная структура данных.
* Нужно предусмотреть возврат к предыдущей отправной точке (например, при поиске выхода из лабиринта).
* Глубина рекурсивных вызовов находится в пределах разумного и не приведет к переполнению стека.
* Во всех остальных случаях целесообразнее использовать итерацию либо итерацию и стек.



### Бонус от меня -  вариация популярной задачи (задача рюкзака) на динамическое программирование с собеседований

Капитан пиратского корабля награбил больше, чем рассчитывал,а грузоподъемность его судна ограничена. Помогите ему найти комбинацию наиболее ценных предметов с учетом того, что на корабль можно загружать не только целые предметы, но и их части(т.е. загружаем корабль до полной вместимости, а если какой-то предмет хочется взять, но он не помещается, - забираем его часть).

Предположим, у нас есть два массива. В одном содержатся значения веса всех предметов (weights), а в другом — их стоимость (values). Также нам дана грузоподъемность корабля (cap). Все достаточно просто. Давайте определим наш метод:

In [22]:
def knapsack(cap, values, weights):
    pass

Подумайте, как бы вы разобрались с этой проблемой, если бы были пиратом. Допустим, вам удалось заполучить кольцо с бриллиантом, которое весит мало, но стоит много, и мешок муки, который весит много, но по сравнению в кольцом стоит мало. Естественно, как нормальный пират, кольцо вы возьмете обязательно, а муки отсыпете столько, сколько у вас места останется.

Исходя из этого, стратегия у нас будет такая:

1. Отсортируем наш список предметов по их стоимости на единицу веса.
2. Будем грузить на корабль самые ценные предметы, пока не достигнем предела грузоподъемности.


Сначала мы создадим новый список items, где будут находиться элементы в отсортированном виде. Затем мы переберем в цикле список values (или weights — они все равно имеют одинаковую длину). Для каждого элемента мы будем сохранять его стоимость на единицу веса (value-per-item, vpw), а также вес (зачем он нам нужен, увидите позже).

In [23]:
def knapsack(cap, values, weights):
    items = []
    for i in range(len(values)):
        itemInfo = {
            'vpw': values[i] / weights[i],
            'weight': weights[i]
        }

Далее нам нужно поместить этот элемент в список items. Но мы не можем просто добавить его в конец списка, ведь мы формируем список, отсортированный по vpw. Поэтому, чтобы определить, куда вставить элемент, мы будем обходить список items, сверяя каждый уже имеющийся там vpw с vpw текущего элемента.

Для начала, если список пока пуст, нам нечего сверять. Мы можем просто добавить наш элемент.

В противном случае мы обходим список. Мы не знаем точного числа переходов, которые придется совершить: будем идти по списку до тех пор, пока vpw нашего текущего элемента не окажется меньше, чем vpw элемента в списке. Тут отлично сработает цикл while.

Пришла пора наполнить корабль грузом. Как уже говорилось, мы собираемся перебирать список предметов, удобно отсортированных по убыванию стоимости, и добавлять эти предметы на корабль, пока не достигнем предела грузоподъемности.

Давайте создадим новые переменные. total — финальная стоимость груза, который удастся увезти на корабле (ее мы будем возвращать). Кроме того, мы создадим переменную cap_left для отслеживания, груз какого веса еще может принять корабль после добавления очередного предмета.

По каждому элементу мы сначала будем проверять, поместится ли он целиком (по весу). Если да — добавляем его стоимость к total (стоимость можно найти путем умножения weight на vpw). Не забудьте вычесть вес предмета из cap_left!

Предположим, мы добавили несколько предметов на корабль и еще осталось место, но его недостаточно для добавления следующего целого предмета. Но в условии сказано, предметы можно и делить на части.

Нам нужно проверить, осталось ли место, а затем высчитать, сколько нужно добавить к total. Тут используется математика: мы умножаем vpw элемента, который не помещается полностью, на остаток веса, который еще может принять корабль. После того как мы добавим результат к total, cap_left устанавливается в 0.


In [24]:
def knapsack(cap, values, weights):
    items = []
    for i in range(len(values)):
        itemInfo = {
            'vpw': values[i] / weights[i],
            'weight': weights[i]
        }
        if len(items) == 0:
            items.append(itemInfo)
        else:
            k = 0
            while k < len(items) and items[k]['vpw'] > itemInfo['vpw']:
                k += 1
            items.insert(k, itemInfo)
    total = 0
    cap_left = cap
    for item in items:
        if cap_left - item['weight'] >= 0:
            total += item['weight'] * item['vpw']
            cap_left -= item['weight']
        elif cap_left > 0:
            total += item['vpw'] * cap_left
            cap_left = 0
    return total


Допустим, в нашей добыче есть три предмета: бочка рома, мешок муки и рулон шелка. Вместимость корабля — 60 фунтов.

In [25]:
cap = 60
values = [60, 100, 120]
weights = [20, 50, 30]
print(knapsack(cap, values, weights))

200.0


У шелка самый высокий VPW — 4 монеты за фунт. Следующим идет ром (3) и мука (2). Шелк добавляем первым, затем ром. После этого корабль может принять еще 10 фунтов веса: их мы заполняем мукой. 10 фунтов муки стоят 20 монет. Таким образом, общая стоимость добра, которое мы можем увезти на корабле, — 200 монет.