# Итераторы и генераторы
##### Итераторы - это специальные объекты, которые позволяют получать элементы коллекции один за другим, без необходимости знать внутреннюю структуру данных.

In [1]:
numbers = [1, 2, 3]
for n in numbers:
    print(n)
    del n

1
2
3


В коде выше приведен простейший пример итерирования по коллекции. Переменная `numbers` реализует протокол итератора, так как является итерируемым объектом. Иными словами, интерпретатор Python, натолкнувшись на ключевое слово `for`, создаст итератор и подставит его вместо `numbers`. Списки, строки, кортежи, словари, файлы - все это коллекции данных и в то же время итерируемые объекты.

Итератор — это то, что можно получить из итерируемого объекта. Мы можем сказать, что итератор — это тип, позволяющий реализовать поток данных и представляющий средства для прохода по нему. В Python итератором является любой объект, реализующий протокол итераторов, который должен содержать в себе два метода: __iter()__ и __next()__. Метод __iter()__ должен возвращать итератор. Метод __next()__ — следующий элемент потока данных.

In [13]:
word = [1, 2, 3]  # Другие примеры: строка - 'ABC'; словарь - {'A': 1, 'B': 2, 'C': 3}
print(type(word))
word_iterator = word.__iter__()
print(type(word_iterator))
print(word_iterator.__next__())
print(word_iterator.__next__())
print(word_iterator.__next__())
print(word_iterator.__next__())  # Как только итератор попытается вызвать метод __next__() для несуществующего
                                 # элемента, будет выброшено исключение `StopIteration`

<class 'list'>
<class 'list_iterator'>
1
2
3


StopIteration: 

#### Генераторы

Ниже пример функции `map`, которая "под капотом" реализует протокол генератора. Особенность генераторов в том, что они хранят в себе информацию о текущем значении, которое нужно вернуть. Поэтому к ним также применим метод `__next__()` (в следующих примерах будет демонстрироваться функция `next`, что в сущности тоже самое).

In [28]:
r = map(lambda x: x**x, range(1, 5))
for i in r:
    print(i)
    if i > 5:
        break

print("------")
print(next(r))
print(next(r))

1
4
27
------
256


StopIteration: 

... и при выходе за границы итерируемого объекта, также возникнет исключение `StopIteration`.

Ниже пример реализации самописного генератора. В нем вместо ключевого слова `return`, которое применяет для возврата значение в функциях, применяется `yield`. Таким образом, генератор не возвращает значение с прекращением своей работы, а "отдает" значения по требованию, сохраняя в себе информацию о том, какое значение было отдано последним, дабы при следующем вызове `next` от генератора было возвращено следующее сгенерированное "на лету" (т.е. по требованию, в тот момент, когда мы его об этом попросили) значение.

In [26]:
def counter():
    i=1
    while(i<=10):
        yield i
        i+=1


g = counter()
for i in g:
    print(i)
    if i > 5:
        break

print("------")
print(next(g))
print(next(g))

1
2
3
4
5
6
------
7
8


Основная идея генераторов в том, чтобы не занимать оперативную память сформированным итерируемым объектом целиком, как было бы, например, в случае со списком, хранящим миллион чисел, а "yield'дить" значения в тот момент, когда в них возникает потребность.

Ниже приведен пример генераторного выражения, которое представляет собой "синтаксический сахар", т.е. является удобным и лаконичным способом создать генератор в одну строчку, в частности, без необходимости употреблять ключевое слово `yield`.

In [31]:
gen = (i for i in range(1, 5))
print(gen)
for num in gen:
    print(num)

<generator object <genexpr> at 0x7f21104dc2b0>
1
2
3
4


Как видно выше, переменная `gen` является объектом генератора, который готов к итерированию по нему, но до тех пор значения, которые он может сгенерировать, пока не существуют в оперативной памяти. А ниже пример `генератора списков (list comprehension)`, который также реализует протокол генератора, с той лишь разницей, что результирующий список будет по итогу создан и готов к использованию.

In [32]:
some_nums = [i for i in range(1, 5)]
print(some_nums)

[1, 2, 3, 4]


#### Вывод

Таким образом, **итератор** - это объект языка Python, который представляет доступ к элементам коллекции (списку, кортежу, словарю и т.д.) и навигацию по ним. Иными словами, итератор, проходя (иначе говоря, итерируясь) по коллекции данных, следит за тем, на каком месте он находится, и возвращает текущий элемент.

Если итератор нужен для обхода коллекции и возврата значений поэлементно, то **генератор**, свою очередь, являясь некой оберткой над первым, позволяет генерировать данные при обращении, так же поэлементно.