# СОКРАЩЁННАЯ ЗАПИСЬ ГЕНЕРАТОРОВ

Давайте рассмотрим пример.

Представим ситуацию, мы забыли таблицу квадратов чисел и, чтобы её вспомнить, мы хотим сгенерировать квадраты натуральных чисел от 1 до 10. Напишем для этого генератор square_gen:

In [1]:
# Объявляем генератор square_gen
def square_gen():
    # Создаём цикл для последовательности от 1 до 10
    for x in range(1, 11):
        # Выдаём квадрат числа
        yield x ** 2
gen = square_gen()
print(type(gen))
# Будет выведено:
# <class 'generator'>

<class 'generator'>


- Отлично, генератор создан. Можно даже обернуть сгенерированные числа в список:

In [2]:
square_list = list(gen)
print(square_list)
# Будет выведено
# [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


Но не кажется ли вам, что для такой простой задачи мы написали слишком много кода? Оказывается, можно решить её одной строкой кода с помощью сокращённой формы генератора.

> Для сокращённой формы генератора используются круглые скобки. В них указывается элемент, который должен быть возвращён из генератора с помощью yield, а затем записывается цикл.

Схема перехода от общей формы генератора к сокращенной:


![Image of Yaktocat](https://lms.skillfactory.ru/assets/courseware/v1/898ceae7417e6b3f244e396f0667c42c/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/dst3-u1-md5.2_4_4.png)

In [8]:
square_gen = (x**2 for x in range(1,11))
square_list = list(square_gen)
print(square_list)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


> Важное замечание: можно генерировать списки сразу, без необходимости применения функции list() к объекту-генератору. Достаточно написать выражение для генератора в квадратных скобках, а не в круглых. Такая конструкция называется генератором списка:

In [9]:
# Создаём генератор списка кубов чисел, которые делятся на 3
triple_cubes_list = [x**3 for x in range(1,16) if x % 3 == 0]
print(type(triple_cubes_list))
print(triple_cubes_list)
# Будет напечатано:
# <class 'list'>
# [27, 216, 729, 1728, 3375]

<class 'list'>
[27, 216, 729, 1728, 3375]


> То же самое работает и для множества — достаточно написать фигурные скобки вместо круглых. Такая запись будет называться генератором множества:

In [10]:
# Создаём генератор множества кубов чисел, которые делятся на 3
triple_cubes_set = {x**3 for x in range(1,16) if x % 3 == 0}
print(type(triple_cubes_set))
print(triple_cubes_set)
# Будет напечатано:
# <class 'set'>
# {1728, 3375, 216, 729, 27}

<class 'set'>
{1728, 3375, 216, 729, 27}


> А вот кортеж так получить не выйдет, поскольку круглые скобки используются для создания генераторов. Но и эту проблему можно решить — достаточно окружить выражение для генератора функцией tuple(). Такая запись будет называться генератором кортежей:

In [11]:
triple_cubes_tuple = tuple(x**3 for x in range(1,16) if x % 3 == 0)
print(type(triple_cubes_tuple))
print(triple_cubes_tuple)
# Будет напечатано:
# <class 'tuple'>
# (27, 216, 729, 1728, 3375)

<class 'tuple'>
(27, 216, 729, 1728, 3375)


# Функции map(), filter(), zip(), reduce()

- map()

Начнём, как и всегда, с примера.

В задачах обработки естественного языка иногда имеет значение не только само слово, но и его длина.

Перед нами стоит следующая небольшая задача: вычислить длину каждого слова из нашего набора данных, чтобы в дальнейшем использовать эту информацию для анализа текста.

Пусть нам дан список names с именами. Давайте составим новый список длин имён lens_list из списка names. Самое простое решение — воспользоваться циклом.

In [12]:
names = ['Ivan', 'Nikita', 'Simon', 'Margarita', 'Vasilisa', 'Kim']

# Создаём пустой список, куда будем заносить результаты
lens_list = []
# Создаём цикл по элементам списка names
for name in names:
    # Вычисляем длину текущего слова
    length = len(name)
    # Добавляем вычисленную длину слова в список
    lens_list.append(length)
 
print(lens_list)
# [4, 6, 5, 9, 8, 3]

[4, 6, 5, 9, 8, 3]


- Напишем функцию get_length, которая возвращает длину переданного в неё слова:

In [13]:
# Объявляем функцию для вычисления длины
def get_length(word):
    return len(word)

Теперь применим эту функцию к списку names с помощью специальной встроенной в Python функции map(). Она позволяет преобразовать каждый элемент итерируемого объекта по заданной функции.

Аргументы функции map():

Функция, которую необходимо применить к каждому элементу.
Итерируемый объект (например, список).
 Функция map() возвращает объект типа map.

In [14]:
# Объявляем функцию для вычисления длины
def get_length(word):
    return len(word)
# Применяем функцию get_length к каждому элементу списка
lens = map(get_length, names)
# Проверим, что переменная lens — это объект типа map:
# Для этого воспользуемся функцией isinstance
print(isinstance(lens, map))

True


Ниже представлена схема работы функции map() на нашем примере:

![map](https://lms.skillfactory.ru/assets/courseware/v1/91672636108444210af25a6addb3e981/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/dst3-u1-md5.2_5_1.png)

Объект типа map на самом деле является разновидностью итератора, а значит можно получить его элементы, последовательно применяя функцию next():

In [15]:
# Последовательно получаем элементы итератора map
print(next(lens))
print(next(lens))
print(next(lens))

4
6
5


Кроме того, объекты итератора можно сразу занести в список, обернув результат работы функции map() в функцию list():

In [16]:
# Оборачиваем содержимое итератора map в список
lens_list = list(map(get_length, names))
print(lens_list)

[4, 6, 5, 9, 8, 3]


> Вероятно, вы обратили внимание, что функция get_length является очень простой и короткой: она в одну строку выполняет действие и возвращает значение.

Чтобы не создавать такую функцию отдельно в исходном коде скрипта, напишем аналогичную ей lambda-функцию и применим её с помощью map. Сразу же воспользуемся функцией list(), чтобы получить весь список значений из итератора map:

In [17]:
lens = list(map(lambda x: len(x), names))
print(lens)

[4, 6, 5, 9, 8, 3]


#### **ФУНКЦИЯ FILTER**

→ Часто требуется отобрать из итератора элементы, удовлетворяющие определённому условию.

Например, из списка оценок нашей видеоигры от пользователей необходимо выделить только те оценки, которые выше 70 баллов. Такая операция называется фильтрацией — мы отсекаем данные, которые не проходят фильтр. 

Ранее с помощью функции map() мы получили список длин имён lens_list = [4, 6, 5, 9, 8, 3]. Теперь давайте создадим новый список even_list, в котором будут содержаться только чётные числа из списка lens_list.

In [23]:
# Попробуем решить задачу с помощью цикла:
lens_list = [4, 6, 5, 9, 8, 3]
even_list = []
# Создаём цикл по элементам списка
for item in lens_list:
    # Проверяем условие, что текущий элемент списка чётный
    if item % 2 == 0: # Если условие выполняется,
        # добавляем элемент в новый список
        even_list .append(item)

    
print(even_list)

[4, 6, 8]


> Однако эту задачу можно решить с помощью специальной встроенной в Python функции filter(). Она позволит отфильтровать переданный ей итерируемый объект и оставить в нём только те элементы, которые удовлетворяют условию.

> Её использование аналогично применению функции map().

> Аргументы функции filter():

1. Функция, которая должна возвращать True, если условие выполнено, иначе возвращается False.
1. Итератор, с которым производится действие.

- Функция filter() возвращает объект типа filter.

Напишем функцию, которая возвращает True, если число делится на 2 без остатка, то есть является чётным. В противном случае функция возвращает False:

In [31]:
# Объявляем функцию для проверки чётности числа
def is_even(num):
    if num % 2 == 0:
        return True
    return False


lens_list = [4, 6, 5, 9, 8, 3]
# Применяем функцию is_even к каждому элементу списка
even = filter(is_even, lens_list)
# Убедимся, что even — объект типа filter
print(isinstance(even, filter))
print(list(even))

True
[4, 6, 8]


#### **ИЛИ**:

In [34]:
lens_list = [4, 6, 5, 9, 8, 3] 
# Применяем lambda-функцию к каждому элементу списка
even = filter(lambda x: x % 2 == 0, lens_list)
print(list(even))

[4, 6, 8]


#### Конвейры из Map и Filter
- Пример:

Нам задан список имён names:

> names = ['Ivan', 'Nikita', 'Simon', 'Margarita', 'Vasilisa', 'Kim']

Допустим, вначале мы хотим отобрать только те имена, которые состоят из пяти и более букв, а затем посчитать, сколько раз в таких словах встречается буква А. 

1. Отфильтруем наш список по условию len(x) >= 5 с помощью функции filter(). 
1. Напишем функцию, которая приводит имя к верхнему регистру с помощью метода строки upper(), а затем методом строки count() вычисляет количество символов 'A'. Функция возвращает кортеж (имя, число букв 'A'). Нашу функцию-преобразование применим к отфильтрованным данным с помощью map().
1. Конечный результат обернём в список с помощью функции list().
- Наш конвейер, состоящий из filter() и map(), будет иметь вид:

In [35]:
# Отбираем имена из пяти и более букв
long_names = filter(lambda x: len(x) >= 5, names)
# Все отобранные имена переводим в верхний регистр и считаем число букв А в них
# Результат сохраняем в виде кортежа (имя, число букв "A")
count_a = map(lambda x: (x, x.upper().count('A')), long_names)
# Переводим объект map в list и печатаем его
print(list(count_a))

[('Nikita', 1), ('Simon', 0), ('Margarita', 3), ('Vasilisa', 2)]


> Выгодное отличие использования конвейеров без создания списков от итераторов заключается в повышении быстродействия скрипта. Вы не тратите время на распаковку содержимого итератора в список, и это существенно повышает производительность

Те же самые действия мы могли выполнить и с помощью цикла, в котором пустой список заполняется кортежами из двух элементов

In [36]:
names = ['Ivan', 'Nikita', 'Simon', 'Margarita', 'Vasilisa', 'Kim']
# Создаём пустой список, в который будем добавлять результаты
count_a = list()
# Создаём цикл по элементам списка names
for name in names:
    # Проверяем условие, что длина имени больше либо равна 5
    if len(name) >= 5:
        # Добавляем в итоговый список кортеж (имя, число букв "A")
        count_a.append((name, name.upper().count('A')))
print(count_a)

[('Nikita', 1), ('Simon', 0), ('Margarita', 3), ('Vasilisa', 2)]


#### Функция Zip
- Иногда возникает необходимость одновременно получать и обрабатывать элементы из нескольких последовательностей. Представьте, что перед вами несколько параллельных линий конвейера, по каждой из которых идёт отдельная продукция, и вам необходимо следить за каждой из этих линий.

> Для такого совместного использования нескольких коллекций объектов предусмотрена функция zip(). Она принимает в качестве аргументов через запятую итерируемые объекты.

> Результат работы функции zip() — специальный итератор zip. При требовании получить следующий объект (вызове next()) итератор выдаёт кортеж, в котором по порядку перечислено по одному объекту из каждого аргумента.

> В итоге мы получаем параллельную обработку нескольких коллекций объектов сразу.

Рассмотрим пример задачи.

Пусть данные о фамилиях и именах студентов по каким-то причинам хранятся в разных местах, например в двух разных списках. Нам бы хотелось вывести их попарно на экран.

Создадим два списка: в одном будут фамилии, в другом — имена студентов.

Чтобы напечатать их попарно, получим из них объект zip и пройдёмся по нему в цикле for. На каждой итерации цикла объект zip будет возвращать кортеж из двух элементов — фамилии и имени. Для удобства кортеж из элементов zip мы сразу же распаковываем в цикле в понятные переменные surname и name.

Итоговый код:

In [37]:
surnames = ['Ivanov', 'Smirnov', 'Kuznetsova', 'Nikitina']
names = ['Sergej', 'Ivan', 'Maria', 'Elena']
# Создаём цикл по элементам итератора zip — кортежам из фамилий и имён
for surname, name in zip(surnames, names):
    print(surname, name)

Ivanov Sergej
Smirnov Ivan
Kuznetsova Maria
Nikitina Elena


- В функцию zip() подаются два списка: surnames и names. В результате zip() создаёт из двух этих объектов специальный итератор. 

- При каждом новом обращении к полученному zip-итератору с помощью next() он выдаёт следующую пару элементов (кортеж) из каждого списка. Пары образуются последовательно: например, первый элемент из списка surnames образует пару с первым элементом из списка names и т. д.

> Важное замечание: zip перестаёт выдавать элементы тогда, когда заканчиваются элементы в самом коротком итераторе.

#### ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

В Python существуют дополнительные возможности для решения задач с помощью итераторов и функций. Например, они собраны в модуле [functools](https://docs.python.org/3/library/functools.html).


 В этом юните в качестве примера разберём функцию reduce() из этого модуля.

reduce(), как и map() или filter(), в качестве первого аргумента принимает функцию, в качестве второго — итерируемый объект (например, список).

reduce() выполняет следующие действия:

1. Берёт первый и второй элементы из итератора, применяет к ним переданную функцию.

2. Запоминает значение, которое получено в шаге 1, и подставляет его в качестве первого аргумента в функцию. В качестве второго аргумента reduce() получает следующий элемент из генератора. 

3. Действие 2 повторяется до тех пор, пока в итерируемом объекте есть элементы.

4. Функция reduce() возвращает последнее значение, которое вернула функция.

- Рассмотрим работу данной функции на примере — применим с помощью reduce() lambda-функцию произведения двух аргументов к списку чисел от 1 до 5, полученному с помощью функции range(1, 6):

In [39]:
# Импортируем модуль functools
from functools import reduce

iterable = list(range(1, 6))
# Применяем lambda-функцию для вычисления к произведения к списку
reduced = reduce(lambda x,y: x*y, iterable)
print(reduced)

120


Как это произошло:

1. Были умножены первые два элемента из итератора: .

2. Затем результат (число 2) умножили на следующий элемент — число 3.

Получили: .

3. Затем действие 2 повторялось с новыми числами:

4. Наконец, reduce() вернула результат, полученный в ходе последнего запуска функции.

Ниже представлена схема работы функции reduce() на нашем примере:


![ad](https://lms.skillfactory.ru/assets/courseware/v1/78a1d913f97336c2c3390266ee5f0da9/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/dst3-u1-md5.2_5_4.png)

# Декораторы

- Декораторы — это функции, которые изменяют поведение основной функции таким образом, что она продолжает принимать и возвращать те же значения, однако её функционал расширяется.

Рассмотрим пример из жизни.

- Когда вы думаете, как добраться из дома до того или иного места, вы обычно начинаете продумывать свой маршрут от подъезда, а не от двери квартиры, потому что процедура выхода из дома всегда стандартная вне зависимости от того, куда вы направляетесь. 

- Точно так же бывает удобно создать функцию, которая могла бы одинаковым образом расширять функционал переданных в неё функций.

- Создадим простейшую функцию-декоратор. Она будет изменять переданную в неё функцию следующим образом: вначале будут печататься переданные на вход аргументы, вычисляться результат, а затем функция будет печатать его на экран и возвращать в исходный код основного скрипта:

In [2]:
# Декорирующая функция принимает в качестве
# аргумента название функции
def simple_decorator(func):
 
    # Функция, в которой происходит модификация поведения
    # функции func. Она будет принимать те же аргументы,
    # что и функция func, которую декорирует decorated_function.
    # Чтобы принять все возможные аргументы, используем сочетание
    # *args и *kwargs.
    def decorated_function(*args, **kwargs):
        # Печатаем принятые аргументы
        print("Input:")
        print("Positional:", args)
        print("Named:", kwargs)
        # С помощью конструкции *args/**kwargs
        # считаем результат выполнения функции func
        result = func(*args, **kwargs)
        # Печатаем результат выполнения функции
        print("Result:", result)
        # Не забываем вернуть результат, чтобы
        # не повлиять на поведение декорируемой функции!
        return result
    # Внешняя функция возвращает функцию
    # decorated_function
    return decorated_function

> Обратите внимание на общую структуру декоратора: внешняя функция обязательно должна принимать на вход ту функцию, которую она будет изменять (декорировать), а возвращать — декорированную функцию, в которую и будут подставлять аргументы функция.

> Чтобы не повлиять декоратором на входные и выходные данные, используется конструкция *args/**kwargs для получения и передачи аргументов. Также результат обязательно сохраняется в переменную и возвращается по окончании работы декорированной функции. 

- Воспользуемся написанным выше декоратором simple_decorator для функции root, которую мы создавали несколькими юнитами ранее:

In [3]:
def root(value, n=2):
    result = value ** (1/n)
    return result
# Декорируем функцию root с помощью функции simple_decorator
decorated_root = simple_decorator(root)
# В decorated_root теперь действительно хранится функция
print(type(decorated_root))

<class 'function'>


Теперь в функции decorated_root содержится объект, который по типу является функцией. Эта функция принимает на вход те же данные, что и исходная  функция root, и возвращает те же значения, однако она обладает дополнительным функционалом.

Запустим функцию decorated_root:

In [6]:
print(decorated_root(625, 4))

Input:
Positional: (625, 4)
Named: {}
Result: 5.0
5.0


- Как видите, сначала функция напечатала входные и выходные данные, а затем вернула результат (5.0) в исходный код основного скрипта, который мы и напечатали функцией print. 
- В Python декораторы используются довольно часто. Они позволяют значительно упростить жизнь разработчику. Чтобы применять декораторы было удобнее, используется запись названия декоратора через символ @ прямо над сигнатурой основной функции:

In [7]:
@simple_decorator
def root(value, n=2):
    result = value ** (1/n)
    return result

- Такая запись говорит интерпретатору о том, что необходимо применить функцию simple_decorator  к функции root. При этом удобным оказывается то, что название самой декорированной функции от применения декоратора не меняется.
- Воспользуемся декорированной функцией root:

In [11]:
print(root(625))

Input:
Positional: (625,)
Named: {}
Result: 25.0
25.0


Напишем более практичный декоратор. Он будет печатать время работы функции в секундах с помощью функции time() из модуля time:

In [27]:
# Из модуля time импортируем функцию time
from time import time
 
def time_decorator(func):
    def decorated_func(*args, **kwargs):
        # Получаем время на момент начала вычисления
        start = time()
        result = func(*args, **kwargs)
        # Получаем время на момент окончания вычисления
        end = time()
        # Считаем длительность вычисления
        delta = end - start
        # Печатаем время работы функции
        print("Runtime:", delta)
        return result
    return decorated_func

Применим новый декоратор time_decorator к функции root и несколько раз посчитаем время вычислений:

In [28]:
@time_decorator
def root(value, n=2):
    result = value ** (1/n)
    return result
 
print(root(81))
print(root(81))
print(root(81))
print(root(81))

Runtime: 0.0
9.0
Runtime: 0.0
9.0
Runtime: 0.0
9.0
Runtime: 0.0
9.0


Чтобы оценить среднее время вычисления, необходимо запустить функцию большое число раз и посчитать среднее время одного запуска — тогда стоит ожидать более качественные результаты. 

Как передать декоратору, сколько раз необходимо запустить функцию перед усреднением?

К сожалению, сделать это не совсем просто. Для этого потребуется написать декоратор для декоратора. Вот его полный код:

In [25]:
from time import time
 
# Декоратор, который возвращает декоратор. Он принимает число
# запусков декорируемой функции для усреднения времени
def time_runs(n_runs):
    # Декоратор, который уже будет возвращать непосредственно
    # декорированную функцию
    def time_decorator(func):
        # Функция, в которой непосредственно
        # происходит запуск основной функции
        def decorated_func(*args, **kwargs):
            start = time()
            # Запускаем основную функцию столько раз,
            # сколько передано в n_runs
            for i in range(n_runs):
                result = func(*args, **kwargs)
            end = time()
            # Считаем разницу во времени
            delta = end - start
            # Делим разницу на число запусков, чтобы получить
            # среднее время одного запуска
            mean_time = delta / n_runs
            # Печатаем полученное среднее время
            print("Mean runtime:", mean_time)
            # Не забываем вернуть сам результат
            return result
        # Возвращаем функцию, в которой происходит запуск основной функции
        return decorated_func
    # Возвращаем декоратор, который будет применяться к функции
    return time_decorator

- Самая внешняя функция принимает на вход число запусков функции.

> Важно менять число запусков при использовании декоратора для различных функций, поскольку некоторые функции могут выполняться очень быстро, а другие — очень медленно. Если задать слишком большое число для медленной функции, можно не дождаться результата её выполнения. 

- Данная внешняя функция возвращает среднюю функцию — ту самую функцию-генератор, которую будет использовать интерпретатор для декорирования основной функции. 

- Средняя функция возвращает внутреннюю функцию, которая и запускает основную функцию n_runs раз и печатает среднее время для одного запуска.

Применим декоратор time_runs с параметром n_runs=1000000 к функции root и посчитаем время:

In [26]:
@time_runs(1000000)
def root(value, n=2):
    result = value ** (1/n)
    return result
 
print(root(81))
print(root(81))
print(root(81))
print(root(81))

Mean runtime: 5.386893749237061e-07
9.0
Mean runtime: 4.812281131744385e-07
9.0
Mean runtime: 4.746658802032471e-07
9.0
Mean runtime: 4.982585906982422e-07
9.0
