## Выражения-генераторы

При создании генератора списков в квадратных скобках описывается некий алгоритм, по которому формируются его значения:

In [1]:
a = [x for x in range(1, 9)]
a

[1, 2, 3, 4, 5, 6, 7, 8]

Аналогично с множествами:

In [2]:
b = {x for x in range (1, 9)}
b

{1, 2, 3, 4, 5, 6, 7, 8}

И словарями:

In [3]:
c = {x: x ** 2 for x in range (1, 9)}
c

{1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64}

In [4]:
c = {f'Квадрат числа {x}': x ** 2 for x in range (1, 9)}
c

{'Квадрат числа 1': 1,
 'Квадрат числа 2': 4,
 'Квадрат числа 3': 9,
 'Квадрат числа 4': 16,
 'Квадрат числа 5': 25,
 'Квадрат числа 6': 36,
 'Квадрат числа 7': 49,
 'Квадрат числа 8': 64}

Все эти значения были сгенерированы внутренним генератором, который последовательно с помощью функции next выдавал очередное значение, и это значение записывалось в список/множество/словарь. На выходе - определенный список/множество/словарь с определенными значениями.

В python можно определить чистый генератор, без привязки к какой либо коллекции. Для этого используется такой же синтаксис, как и для генераторов коллекций, но все записывается в круглых скобках:

In [5]:
(x for x in range(1, 9))

<generator object <genexpr> at 0x0000020DEB5870B0>

Круглые скобки не означают кортеж, так как генераторов кортежей не существует. На выходе будет чистый генератор. Ссылку на него можно сохранить в какую либо переменную:

In [6]:
g = (x for x in range(1, 4))

Чтобы получить из него какие либо значения, нужно вызвать функцию next, так как генератор сам по себе также является и итератором:

In [7]:
next(g)

1

In [8]:
next(g)

2

In [9]:
next(g)

3

Когда будет достинут конец, вызывается исключение StopIteration:

In [10]:
# next(g)

Т.е. все происходит так же, как и с обычным итератором, когда происходит его перебор через функцию next. 

Так как перебор генератора происходит с помощью механизма итератора, то перебор его элементов можно осуществлять только один раз:

Допустим, что существует генератор:

In [11]:
gen = (x ** 2 for x in range(5))

Который перебирается с помощью цикла for (генератор является итерируемым объектом). На выходе - все числа, сформированные генератором:

In [12]:
for x in gen:
    print(x)

0
1
4
9
16


Но при повторном переборе на выходе ничего не будет получено:

In [13]:
for x in gen:
    print(x)

Некоторые функции, например list, set, sum, max, min и другие позволяют непосредственно работать с итераторами, а значит и с генераторами. В качестве аргумента им можно передать генератор:

In [14]:
gen = (x ** 2 for x in range(5))

list(gen)

[0, 1, 4, 9, 16]

In [15]:
gen = (x ** 2 for x in range(5))

set(gen)

{0, 1, 4, 9, 16}

In [16]:
gen = (x ** 2 for x in range(5))

max(gen)

16

In [17]:
gen = (x ** 2 for x in range(5))

min(gen)

0

Но так как генератор можно перебирать только один раз, второй раз подобной функцией для него воспользоваться не получится:

In [18]:
list(gen)

[]

Можно определить генератор и напрямую:

In [19]:
sum((x ** 2 for x in range(5)))

30

Для чего нужны выражения генераторы? Эти объекты по сравнению с обычными списками не хранят в памяти сразу все значения, а генерируют их по мере необходимости. Допустим, нужно создать список из большого числа элементов:

In [20]:
# lst = list(range(10000000000000))

Возникнет ошибка памяти. Но выражение генератор с таким большим числом элементов создать можно, так как они не хранятся в памяти:

In [21]:
lst = (x for x in range(10000000000000))

И они будут формироваться по мере перебора этого генератора:

In [22]:
for x in lst:
    print(x)
    if x > 10:
        break

0
1
2
3
4
5
6
7
8
9
10
11


По этой же причине нельзя пользоваться такими функциями, как len:

In [23]:
h = (x+1 for x in range(10))
# len(h)

И обращаться по индексу:

In [24]:
# h[0]

Если требуется работать с генераторами как с элементами списка, их нужно преобразовать в список:

In [25]:
j = list(h)

In [26]:
j

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [27]:
j[0]

1

In [28]:
len(j)

10