# Генераторы

Понятие генератора тесно связано с сущностью [итератора](iterator_and_generator.ipynb). Генератор в Python — это специальная функция, которая возвращает итератор, с помощью которого можно обойти некоторую последовательность значений. Отличительная особенность генератора от итератора в том, что он не только возвращает данные поэлементно, но также их генерирует в процессе итерирования (обхода). Такое отложенное создание результата в процессе обхода элементов является основным преимуществом генераторов.

Для начала рассмотрим пример генераторного выражения, которое очень схоже со списковым включением (list comprehension или генератор списков):

In [1]:
squares = (i**2 for i in range(100))
print(squares)

for sq in squares:
    print(sq)
    if sq > 5:
        break

<generator object <genexpr> at 0x7fcc75fbe810>
0
1
4
9


Как видно выше, переменная `squares` не является списком (являлась бы, если вместо круглых скобок стояли квадратные - `[i**2 for i in range(100)]`). Вывод нам подсказывает: переменная `squares` - это объект генератора "genexpr", т.е. генераторное выражение, что означает, что интерпретатор, дойдя до данной строчки кода, не сразу вычислит результат выражения, а как бы отложит его до того момента, когда мы его об этом попросим. В примере выше "просьбой" является цикл `for`, во время которого будет происходить итерирование по элементам генератора с одновременным генерированием значений.

In [2]:
print(next(squares))
print(squares)

16
<generator object <genexpr> at 0x7fcc75fbe810>


Другим примером "просьбы" является вызов функции `next` от генератора. Поскольку при предыдущем итерировании последним выведенным в консоль элементом являлось выражение `3**2`, что было запомнено генератором (он, как и итератор, запоминает текущее состояние), то при вызове следующего элемента будет сгенерирован и выведен в консоль результат выражения `4**2`.

Создание генератора через генераторное выражение - не единственный способ его реализации. В общем случае, генератором является любая функция, в которой вместо возврата значений через `return` применяется ключевое `yield`. Последнее близко по смыслу к обычному `return`, но разница все же есть и заключается она в том, что `yield` используется для возврата из функции с сохранением состояния ее локальных переменных. При повторном вызове такой функции выполнение продолжается с оператора `yield`, на котором ее работа была прервана. Любая функция, содержащая упомянутое ключевое слово, называется генератором.

Рассмотрим пример реализации простейшего генератора:

In [15]:
def gen():
    for i in range(1, 3):
        yield i

print(gen())

<generator object gen at 0x7fd4f23c35e0>


Как видно выше, вызов функции `gen()` не возвращает значение переменной `i`, вместо этого интерпретатор подсказывает нам, что данная функция является объектом генератора. Чтобы все же получить значения из нее, можно применять уже знакомую функцию `next()`:

In [20]:
g = gen()
print(next(g))
print(next(g))


1
2


Вопрос для самопроверки: а что произойдет, если к двух вызовам функции `print` в блоке выше добавить третий?

In [22]:
print(next(g))

StopIteration: 

Разумеется, возникнет исключение `StopIteration` :))