Тема урока: рекурсия
Рекурсивный обход коллекций
Настройка глубины рекурсии в Python
Аннотация. Урок посвящен рекурсии.

Рекурсивный обход коллекций

Рекурсия является незаменимым помощником при работе с вложенными структурами данных. Рассмотрим несколько задач.

Задача 1. Дан список, элементами которого могут быть только строки или аналогичные списки, содержащие строки и вложенные списки. Необходимо вывести все строки из данного списка и из всех вложенных, разделив пробелом.

Решение. Реализуем рекурсивную функцию get_all_str(), которая принимает в качестве аргумента указанный список и выводит его содержимое в соответствии с условием задачи.

Итак, для начала определимся с базовым случаем. Он простой: если элемент является строкой, вернем ее саму.

В противном случае нам нужно с помощью цикла for пройтись по всем элементам списка, чтобы понять, есть ли среди них вложенные списки. И если есть, то мы используем рекурсию: вызываем нашу же функцию и передаем ей в качестве аргумента новый список.

Рекурсивная реализация функции get_all_str():

In [1]:
def get_all_str(data):
    if type(data) == str:
        print(data, end=' ')            # базовый случай
    if type(data) == list:
        for i in data:
            get_all_str(i)              # рекурсивный случай

In [2]:
numbers = ['1', ['2', '3', ['4'], ['5', ['6', '7']]]]
get_all_str(numbers)

1 2 3 4 5 6 7 

Задача 2. Дан словарь произвольной вложенности, то есть значениями в словаре могут быть другие словари. Необходимо определить значение, которое соответствует заданному ключу, и вернуть его. При этом гарантируется, что такой ключ имеется в словаре, причем он единственный. 

Решение. Реализуем рекурсивную функцию find_key(), которая принимает два аргумента в следующем порядке:

data — словарь произвольной вложенности
key — ключ, значение которого нужно вернуть

Итак, для начала определимся с базовым случаем. Он простой: если ключ есть в словаре, вернем его значение.

В противном случае нам нужно с помощью цикла for пройтись по всем ключам и значениям словаря, чтобы понять, есть ли среди значений вложенные словари. И если значением является вложенный словарь, то мы используем рекурсию: вызываем нашу же функцию и передаем ей в качестве аргумента новый словарь. 

 Рекурсивная реализация функции find_key():

In [4]:
def find_key(data, key):
    if key in data:
        return data[key]                # базовый случай
    
    for v in data.values():
        if type(v) == dict:
            value = find_key(v, key)    # рекурсивный случай
            if value is not None:
                return value

In [5]:
info = {'name': 'Alyson', 
        'surname': 'Hannigan', 
        'birthday': {'day': 24, 'month': 'March', 'year': 1974},
        'family': {'parents': {'mother': 'Emilie Posner', 'father': 'Alan Hannigan'}}}

print(find_key(info, 'year'))
print(find_key(info, 'father'))

1974
Alan Hannigan


Настройка глубины рекурсии в Python

По умолчанию Python имеет ограничение на максимальную глубину рекурсивных вызовов. Это ограничение не позволяет бесконечной рекурсии вызывать переполнение стека.

Получить значение по умолчанию для максимальной глубины рекурсии можно с помощью функции getrecursionlimit() из модуля sys.

In [6]:
from sys import getrecursionlimit

limit = getrecursionlimit()

print(limit)

3000


Мы также можем явно установить значение максимальной глубины рекурсии. Для этого используется функция setrecursionlimit() из модуля sys.

In [None]:
import sys

limit = sys.getrecursionlimit()
print(limit)

sys.setrecursionlimit(6000)
new_limit = sys.getrecursionlimit()
print(new_limit)

Зачастую значения по умолчанию хватает для любых задач, и изменять его следует с осторожностью, потому что слишком высокий предел может привести к сбою. Если текущего значения глубины не хватает, то имеет смысл для безопасности использовать итеративный алгоритм, а не рекурсивный.

Примечание
Примечание. Рекомендуемые книги для дальнейшего углубленного изучения рекурсии:

Рубио-Санчес М. "Введение в рекурсивное программирование"
Eric S. Roberts "Thinking Recursively"

Функция recursive_sum()
Реализуйте recursive_sum() с использованием рекурсии, которая принимает один аргумент:

nested_lists — список, элементами которого являются целые числа или списки, элементами которых, в свою очередь, также являются либо целые числа, либо списки; вложенность может быть произвольной
Функция должна вычислять сумму всех чисел во всех списках и возвращать полученный результат. Если список nested_lists пуст, функция должна вернуть число 0.

In [27]:
l = []
def recursive_sum(data: list):
    if isinstance(data, int):
        l.append(data)
    if isinstance(data, list):
        for i in data:
            recursive_sum(i)              # рекурсивный случай
    return sum(l)

# my_list = [1, [4, 4], 2, [1, [2, 10]]]
# 
# print(recursive_sum(my_list))

my_list = []

print(recursive_sum(my_list))

0


In [None]:
def recursive_sum(nested_lists):
    total = 0
    for elem in nested_lists:
        if isinstance(elem, list):
            total += recursive_sum(elem)
        else:
            total += elem
    return total

In [24]:
def get_all_str(data):
    if type(data) == str:
        print(data, end=' ')            # базовый случай
    if type(data) == list:
        for i in data:
            get_all_str(i)              # рекурсивный случай
            
my_list = [1, [4, 4], 2, [1, [2, 10]]]

print(get_all_str(my_list))

1
4
4
2
1
2
10
None


Функция linear()
Линеаризация — это процесс преобразования списка, который может содержать несколько уровней вложенных списков, в список, содержащий все те же элементы без какой-либо вложенности.

Например, список:

[1, [2, 3], [4, [5, 6, [7, 8, 9]]]]
после линеаризации будет иметь вид:

[1, 2, 3, 4, 5, 6, 7, 8, 9]
Реализуйте linear() с использованием рекурсии, которая принимает один аргумент:

nested_lists — список, элементами которого являются целые числа или списки, элементами которых, в свою очередь, также являются либо целые числа, либо списки; вложенность может быть произвольной
Функция должна возвращать новый список, представляющий собой линеаризованный список nested_lists

In [45]:
def linear(nested_lists: list) -> list:
    l = []
    def inner(data):
        if isinstance(data, int):
            l.append(data)
        elif isinstance(data, list):
            for i in data:
                inner(i)
    inner(nested_lists)
    return l

my_list = [3, [4], [5, [6, [7, 8]]]]
print(linear(my_list))

my_list = [3, [4], [5, [6, [7, 8]]]]
print(linear(my_list))

[3, 4, 5, 6, 7, 8]
[3, 4, 5, 6, 7, 8]


Функция get_value()
Реализуйте функцию get_value(), которая принимает два аргумента в следующем порядке:

nested_dicts — словарь, содержащий в качестве значений произвольные объекты или словари, которые, в свою очередь, так же содержат в качестве значений произвольные объекты или словари; вложенность может быть произвольной
key — хешируемый объект
Функция должна определять значение, которое соответствует ключу key в словаре nested_dicts или в одном из его вложенных словарей, и возвращать полученный результат.

Примечание 1. Гарантируется, что ключ key присутствует в словаре nested_dicts или в одном из его вложенных словарей, причем в единственном экземпляре.

In [48]:
def get_value(nested_dicts: dict, key):
    if key in nested_dicts:
        return nested_dicts[key]
    
    for i in nested_dicts.values():
        if isinstance(i, dict):
            value = get_value(i, key)
            if value is not None:
                return value


data = {'firstName': 'Тимур', 'lastName': 'Гуев', 'birthDate': {'day': 10, 'month': 'October', 'year': 1993}, 'address': {'streetAddress': 'Часовая 25, кв. 127', 'city': {'region': 'Московская область', 'type': 'город', 'cityName': 'Москва'}, 'postalCode': '125315'}}

print(get_value(data, 'cityName'))

Москва


In [None]:
from collections import ChainMap

def get_value(nested_dicts, key):
    if key in nested_dicts:
        return nested_dicts[key]

    return get_value(ChainMap(*[v for v in nested_dicts.values() if isinstance(v, dict)]), key)

Функция get_all_values() 🌶️
Реализуйте функцию get_all_values(), которая принимает два аргумента в следующем порядке:

nested_dicts — словарь, содержащий в качестве значений произвольные объекты или словари, которые, в свою очередь, так же содержат в качестве значений произвольные объекты или словари; вложенность может быть произвольной
key — хешируемый объект
Функция должна определять все значения, которые соответствуют ключу key в словаре nested_dicts и всех его вложенных словарях, и возвращать их в виде множества. Если ключа key нет ни в одном словаре, функция должна вернуть пустое множество.

Примечание 1. Гарантируется, что все искомые значения являются хешируемыми объектами, т.е. могут быть элементами множества.

In [51]:
def get_all_values(nested_dicts: dict, key):
    st = set()
    for k, v in nested_dicts.items():
        if key == k:
            st.add(v)
            
    for i in nested_dicts.values():
        if isinstance(i, dict):
            value = get_all_values(i, key)
            if value is not None:
                st.update(value)
    return st

my_dict = {'users': {'Arthur': {'grades': [4, 4, 3], 'top_grade': 4}, 'Timur': {'grades': [5, 5, 5], 'top_grade': 5}}}
result = get_all_values(my_dict, 'top_grade')

print(*sorted(result))

my_dict = {'Arthur': {'hobby': 'videogames', 'drink': 'cacao'}, 'Timur': {'hobby': 'math'}}
result = get_all_values(my_dict, 'hobby')

print(*sorted(result))

4 5
math videogames


In [None]:
def get_all_values(nested_dicts, key, res=()):
    res=set()
    for k,v in nested_dicts.items():
        if key in nested_dicts:
            res.add(nested_dicts[key])
        if type(v)==dict:
            res.update(get_all_values(v,key))
    return res

можно даже не проверять наличие ключа... просто в конце - вычесть None из сета

In [None]:
def get_all_values(nested_dict: dict, key: object) -> set:
    res = {nested_dict.get(key)}
    for v in nested_dict.values():
        if isinstance(v, dict):
            res.update(get_all_values(v, key))
    return res - {None}

Функция dict_travel() 🌶️🌶️
Реализуйте функцию dict_travel(), которая принимает один аргумент:

nested_dicts — словарь, содержащий в качестве значений числа, строки или словари, которые, в свою очередь, так же содержат в качестве значений числа, строки или словари; вложенность может быть произвольной
Функция должна выводить все пары ключ-значение словаря nested_dicts, а также значения всех его дочерних словарей. При выводе значений дочерних словарей необходимо перечислять имена всех ключей, начиная с верхнего уровня, разделяя их точками.

Например, в словаре:

{'name': 'Arthur', 'grades': {'math': 4, 'chemistry': 3}}
значение 4 должно быть выведено в следующем формате:

grades.math: 4
Все пары ключ-значение должны быть расположены в лексикографическом порядке, каждая на отдельной строке.

Примечание 1. Гарантируется, что ключами в подаваемом в функцию словаре являются строки, содержащие только латинские буквы в нижнем регистре.

Примечание 2. Гарантируется, что ни один ключ в подаваемом в функцию словаре не является последовательностью других ключей. Другими словами, словарь не может иметь, например, следующий вид:

{'b.c': 1, 'b': {'c': 30, 'a': 10, 'b': 20}}

In [129]:
def dict_travel(nested_dicts: dict, path = None):

    def inner_function(nested_dicts: dict, path = None):
        if path is None:
            path = list()
            
        final_list = list()
        for k, v in nested_dicts.items():
            if isinstance(v, dict):
                result = inner_function(v, path + [k])
                if result:
                    final_list.extend(result)
            else:
                final_list.append(f"{'.'.join(path + [k])}: {v}")
        
        final_list.sort()    

        return final_list
    result = inner_function(nested_dicts, path)
    
    for i in result:
        print(i)

data = {'a': 1, 'b': {'c': 30, 'a': 10, 'b': 20}}

dict_travel(data)

a: 1
b.a: 10
b.b: 20
b.c: 30


In [None]:
def dict_travel(data):
    
    for k, v in sorted(data.items()):
        if isinstance(v, dict):
            dict_travel({f'{k}.{key}': val for key, val in v.items()})
        else:
            print(f'{k}: {v}') 

In [None]:
def dict_travel(data, path=''):

    for k, v in sorted(data.items()):
        if type(v) == dict:
            dict_travel(v, path + '.' + k)
        else:
            print(f"{(path + '.' + k)[1:]}: {v}")