Центр непрерывного образования

# Программа «Python для автоматизации и анализа данных»

Неделя 4

*Ян Пиле, Татьяна Рогович, НИУ ВШЭ*  

# Декораторы, Генераторы, Рекурсия.

### Рекурсия

Рекурсия — это техника в Computer Science, когда функция вызывает сама себя. Самый известный пример — вычисление факториала n! = n * n — 1 * n -2 * … 2 *1. Зная, что 0! = 1, факториал можно записать следующим образом:

In [1]:
def factorial(n):
    if n != 0:
        return n * factorial(n-1)
    else:
        return 1

# В этой реализации есть некоторые проблемы, но мы поговорим об этом потом :)

In [4]:
%%timeit
factorial(50)

6.16 µs ± 149 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


Каждый раз, когда функция вызывает себя и сохраняет некоторую память. Таким образом, рекурсивная функция может содержать гораздо больше памяти, чем традиционная функция. Python останавливает вызовы функций после глубины в 1000 вызовов. Если вы запустите этот пример, получите ошибку.

In [3]:
def factorial(n):
    if n == 1:
        return 1
    else:
        return n * factorial(n-1)

print(factorial(3000))

RecursionError: maximum recursion depth exceeded in comparison

А еще таким же образом можно вычислять N-ое число Фибоначчи (они как раз задаются рекурсивно).
Заодно здесь мы видим, что выражений return может быть несколько (для различных условий)

In [6]:
def fibonacci(n):
    if n in (1, 2):
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)

In [14]:
for i in range(1,6):
    print(fibonacci(i), end=' ')

1 1 2 3 5 

### Рекурсивно посчитать сумму чисел от 1 до N

Вход: N

Выход: sum(1,2,3,...,N)


Вход: 3

Выход: 6

In [16]:
def add(n):
    if n == 0:
        return 0
    return n + add(n - 1)

In [17]:
add(10)

55

### Рекурсивно проверить, является ли строка палиндромом

Вход: ололо

Выход: True


Вход: You shall not pass!

Выход: False

In [18]:
def IsPalindrome(S):
    if len(S) <= 1:
        return True
    else:
        return S[0] == S[-1] and IsPalindrome(S[1:-1])

In [37]:
IsPalindrome('ололо')

True

### Очень полезный пример про рекурсию
### Быстрое возведение в степень

Одним из полезных применений рекурсии является алгоритм быстрого возведения в степень. Если вычислять степень числа a в степень N при помощи простого цикла, то понадобится n-1 умножение. Но можно решить все это быстрее, воспользовавшись рекуррентными соотношениями:

Для нечетных N: \begin{eqnarray} a^n = a^{n-1}a \end{eqnarray} 

Для четных N: \begin{eqnarray} a^n = (a^{n/2})^2 \end{eqnarray}

Это позволяет записать алгоритм, который будет выполнять не более чем за: \begin{eqnarray} 2*log_2(n) \end{eqnarray} умножений

In [33]:
def power(a, n):
    if n == 0:
        return 1
    elif n % 2 == 1:
        return power(a, n - 1) * a
    else:
        return power(a, n // 2) ** 2

In [34]:
# 5 операций вместо 19
power(2,20)

1048576

### Возврат нескольких значений

Нужно упомянуть еще один факт: по команде return функция может возвращать несколько значений. Например вот функция, которая умеет выводить сумму и разность двух аргументов функции:

In [39]:
def sum_diff(a,b):
    return a+b, a-b

sum, diff = sum_diff(4,1)
print(sum)
print(diff)

5
3


### Генераторы
Мы уже сталкивались с понятием генератора (специального способа создания итераторов). Мы уже делали их с помощью генераторов списков (пишется списковое включение в круглых скобках). Есть еще один способ создания генераторов - через написание функций с последующей заменой выражения return на yield. Давайте посмотрим:

In [40]:
def createGenerator() :
    mylist = range(3)
    for i in mylist :
        yield i*i

In [41]:
mygenerator = createGenerator()
print(type(mygenerator))
for i in mygenerator:
     print(i)

<class 'generator'>
0
1
4


In [42]:
mygenerator = createGenerator()
print(next(mygenerator))
print(next(mygenerator))
print(next(mygenerator))
print(next(mygenerator))

0
1
4


StopIteration: 

В данном случае пример бесполезный, но это удобно, если вы знаете, что функция вернёт большой набор значений, который надо будет прочитать только один раз.

Чтобы освоить yield, вы должны понимать, что когда вы вызываете функцию, код внутри тела функции не исполняется. Функция только возвращает объект-генератор — немного мудрёно :-)

Ваш код будет вызываться каждый раз, когда for обращается к генератору.

Теперь трудная часть:

В первый запуск вашей функции, она будет исполняться от начала до того момента, когда она наткнётся на yield — тогда она вернёт первое значение из цикла. На каждый следующий вызов будет происходить ещё одна итерация написанного вами цикла, возвращаться будет следующее значение — и так пока значения не кончатся.


Например можно написать генератор бесконечной последовательности, который будет вызывать элемент в тот момент, когда будет выполнять с ним какие-то действия:

In [43]:
def infinite_sequence():
    num = 0
    while True:
        yield num
        num += 1

In [44]:
gen = infinite_sequence()

print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))

0
1
2
3


Давайте вернемся к числам Фибоначчи и будем генерировать их с помощью генератора

In [48]:
def fib(n):
    a, b = 0, 1
    for _ in range(n):
        yield a
        a, b = b, a + b

In [46]:
a = fib(10)
print(next(a))
print(next(a))
print(next(a))
print(next(a))
print(next(a))
print(next(a))

0
1
1
2
3
5


Тут мы использовали еще одну классную конструкцию: for _ in collection. Это означает, что переменную из collection нам использовать не нужно - просто нужно выполнить операцию столько раз, сколько в коллекции элементов. Это что-то вроде конвенции (Если не хотим использовать переменную из collection, то при проходе в цикле for стандартное i, например, заменяется на _. 

Также этот символ может быть использован для того, чтобы достать последнее значение из интерпретатора:

In [49]:
5+5

10

In [50]:
# Ожидаемо это 10
_

10

In [51]:
# а еще с ним можно производить стандартные операции
_+1

11

In [52]:
# А тут в _ уже перезаписалось 11
_

11

In [53]:
# А еще можно присвоить это значение новой переменной!
x = _
x

11

### Декораторы
Декораторы — это, по сути, "обёртки", которые дают нам возможность изменить поведение функции, не изменяя её код.
Звучит мудрёно. Посмотрим на пример:

In [54]:
def my_shiny_new_decorator(function_to_decorate):
    # Внутри себя декоратор определяет функцию-"обёртку". Она будет обёрнута вокруг декорируемой,
    # получая возможность исполнять произвольный код до и после неё.
    def the_wrapper_around_the_original_function():
        print("Я - код, который отработает до вызова функции")
        function_to_decorate() # Сама функция
        print("А я - код, срабатывающий после")
    # Вернём эту функцию
    return the_wrapper_around_the_original_function

In [55]:
def stand_alone_function():
    print("Я простая одинокая функция, ты ведь не посмеешь меня изменять?")

stand_alone_function()

Я простая одинокая функция, ты ведь не посмеешь меня изменять?


In [56]:
# Однако, чтобы изменить её поведение, мы можем декорировать её, то есть просто передать декоратору,
# который обернет исходную функцию в любой код, который нам потребуется, и вернёт новую,
# готовую к использованию функцию:
stand_alone_function_decorated = my_shiny_new_decorator(stand_alone_function)
stand_alone_function_decorated()

Я - код, который отработает до вызова функции
Я простая одинокая функция, ты ведь не посмеешь меня изменять?
А я - код, срабатывающий после


Декораторы могут быть использованы для расширения возможностей функций из сторонних библиотек (код которых мы не можем изменять), или для упрощения отладки (мы не хотим изменять код, который ещё не устоялся).

Также полезно использовать декораторы для расширения различных функций одним и тем же кодом, без повторного его переписывания каждый раз.

### Пример 1. Декоратор для вычисления времени работы функции:

In [78]:
# Декоратор 1
def benchmark(func):
    """
    Декоратор, выводящий время, которое заняло
    выполнение декорируемой функции.
    """
    import time
    def wrapper(*args, **kwargs):
        t = time.clock() # Засекли время начала выполнения
        res = func(*args, **kwargs) # Запустили
        print(f'{func.__name__} worked for {round(time.clock() - t,4)} seconds') # Засекли время окончания исполнения и вывели время конца- время начала
        return res
    return wrapper

In [79]:
@benchmark 
def reverse_string(string):
    return ''.join(reversed(string))

In [80]:
print(reverse_string("А роза упала на лапу Азора"))

reverse_string worked for 0.0 seconds
арозА упал ан алапу азор А


Те же самые декораторы можно запустить для любой функции. Например, для функции, которая считает количество вхождений некоторого слова в текст романа Достоевского "Идиот"

In [81]:
import requests
import re
from random import randint

@benchmark
def get_random_idiot_word_count(word):
    the_idiot_url = 'https://www.gutenberg.org/files/2638/2638-0.txt'

    # Отправляем запрос в библиотеку Gutenberg и забираем текст
    raw = requests.get(the_idiot_url).text
    #Заменим в тексте все небуквенные символы на пробелы
    processed_book = re.sub('[\W]+' , ' ', raw).lower()
    return len(re.findall(word.lower(),processed_book))

get_random_idiot_word_count('the')

get_random_idiot_word_count worked for 5.8771 seconds


15891