# Итераторы и Генераторы

# timer

In [9]:
import sys
import time
reps = 1000
repslist = range(reps)
def timer(func, *pargs, **kargs):
    start = time.process_time()
    for i in repslist:
        ret = func(*pargs, **kargs)
    elapsed = time.process_time() - start
    return (elapsed, ret)

In [15]:
def forLoop():
    res = []
    for x in repslist:
        res.append(abs(x))
    return res
def listComp():
    return [abs(x) for x in repslist]
def mapCall():
    return list(map(abs, repslist)) # Вызов list необходим только в 3.0
def genExpr():
    return list(abs(x) for x in repslist) # Функция list вынуждает

In [16]:
print(sys.version)
for test in (forLoop, listComp, mapCall, genExpr):
    elapsed, result = timer(test)
    print ('-' * 33)
    print ('%-9s: %.5f => [%s...%s]' %
            (test.__name__, elapsed, result[0], result[-1]))

3.7.3 (default, Apr 24 2019, 15:29:51) [MSC v.1915 64 bit (AMD64)]
---------------------------------
forLoop  : 0.09360 => [0...999]
---------------------------------
listComp : 0.06240 => [0...999]
---------------------------------
mapCall  : 0.03120 => [0...999]
---------------------------------
genExpr  : 0.07800 => [0...999]


# Итераторы

In [9]:
>>> L = [1, 2, 3]
>>> I = iter(L) # Получить объект-итератор
>>> I.__next__() # вызвать next можно только от объекта итератора
#объект итератор имеет метода __next__, который вызывает функция next()

1

In [12]:
>>> f = open('test.txt')
>>> iter(f) is f   #объекты-файлы имеют свой собственный итератор То есть объекты файлов имеют собственный метод __next__

True
>>> f.__next__()

'Line 1\n'

In [16]:
L = [1, 2, 3]
>>> I = iter(L) # Ручной способ итераций: имитация цикла for
>>> while True:
...  try: # Инструкция try обрабатывает исключения
...   X = next(I) # Или I.__next__
...  except StopIteration:
...   break
...  print(X ** 2, end=' ')

1 4 9 

In [18]:
L = [1, 2, 3]
I=iter(L)               #функция iter
next(I)                 #функция next аналог методу __next__

1

In [19]:
>>> D = {'a':1, 'b':2, 'c':3} 
>>> I = iter(D)                   #итератор словаря
>>> next(I)              

'a'

In [24]:
>>> import os
>>> P = os.popen('dir')
>>> P.__next__()

' ’®¬ ў гбва®©бвўҐ C \xadҐ Ё¬ҐҐв ¬ҐвЄЁ.\n'

# Функции генераторы yield

In [7]:
#Функции-генераторы – выглядят как обычные инструкции def, но для воз-
#врата результатов по одному значению за раз используют инструкцию yield,
#которая приостанавливает выполнение функции.
#Функции-генераторы: инструкция yield вместо return
#Такие функции известны как функции-генераторы, потому что они гене-
#рируют последовательность значений с течением времени.
#Замораживание состояния
#В отличие от обычных функций, которые возвращают значение и завершают
#работу, функции-генераторы автоматически приостанавливают и возобнов-
#ляют свое выполнение, при этом сохраняя информацию, необходимую для
#генерации значений.
#Функции-генераторы при приоста-
#новке автоматически сохраняют информацию о своем состоянии, под которым
#понимается вся локальная область видимости, со всеми локальными перемен-
#ными, которая становится доступной сразу же, как только функция возобнов-
#ляет работу.

In [15]:
>>> def gensquares(N):
        for i in range(N):
            yield i ** 2 # Позднее продолжить работу с этого места
gensquares(5) #возвращает генератор

<generator object gensquares at 0x000000000501C408>

In [16]:
list(gensquares(5))

[0, 1, 4, 9, 16]

In [14]:
>>> for i in gensquares(5): # Возобновить работу функции
         print(i, end = ' : ') # Вывести последнее полученное значение

0 : 1 : 4 : 9 : 16 : 

In [40]:
>>> def gen():
        for i in range(10):
            X = yield i
            print(X)
G = gen()            

In [42]:
>>> next(G)

None


1

In [43]:
>>> G.send(77)

77


2

In [44]:
>>> G.send(88)

88


3

In [45]:
>>> G.send(88)

88


4

In [46]:
>>> next(G)

None


5

In [47]:
>>> next(G)

None


6

In [55]:
>>> def timesfour(S): # Функция-генератор
        for c in S:
            yield c * 4
...
>>> G = timesfour('spam')
>>> list(G) # Выполнит итерации автоматически

['ssss', 'pppp', 'aaaa', 'mmmm']

In [61]:
>>> def timesfour(S):
        for c in S:
            yield c * 4
...
>>> G = timesfour('spam') # Функция-генератор действует точно так же
>>> iter(G) is G

True

In [62]:
>>> I1, I2 = iter(G), iter(G)
>>> next(I1)

'ssss'

In [63]:
>>> next(I2)

'pppp'

In [65]:
def mymap(func, *seqs):
    res = []
    for args in zip(*seqs):
        yield func(*args)

# Выражения генераторы

In [None]:
#Выражения-генераторы – напоминают генераторы списков, о которых рас-
#сказывалось в предыдущем разделе, но они не конструируют список с ре-
#зультатами, а возвращают объект, который будет воспроизводить результа-
#ты по требованию.

In [107]:
G = ((x, x * x) for x in range(10))
list(G)

[(0, 0),
 (1, 1),
 (2, 4),
 (3, 9),
 (4, 16),
 (5, 25),
 (6, 36),
 (7, 49),
 (8, 64),
 (9, 81)]

In [48]:
>>> (x ** 2 for x in range(4)) # Выражение-генератор: создает итерируемый объект

<generator object <genexpr> at 0x000000000501C570>

In [50]:
>>> G = (x ** 2 for x in range(4))
>>> next(G)

0

In [51]:
>>> next(G)

1

In [53]:
>>> for num in (x ** 2 for x in range(4)):
        print('%s, %s' % (num, num / 2.0))

0, 0.0
1, 0.5
4, 2.0
9, 4.5


In [54]:
>>> sum(x ** 2 for x in range(4))

14

In [57]:
>>> G = (c * 4 for c in 'SPAM')
>>> iter(G) is G # Итератором генератора является сам генератор:
True               # G имеет метод __next__

True

In [58]:
>>> G = (c * 4 for c in 'SPAM') # Создать новый генератор
>>> I1 = iter(G) # Выполнить итерацию вручную
>>> next(I1)

'SSSS'

In [59]:
>>> I2 = iter(G) # Второй итератор
>>> next(I2) # ссылается на ту же позицию!

'PPPP'

In [64]:
def mymap(func, *seqs):
    return (func(*args) for args in zip(*seqs))

# Генераторы

In [6]:
listoftuple = [('bob', 35, 'mgr'), ('mel', 40, 'dev')]
>>> [age for (name, age, job) in listoftuple]

[35, 40]

In [3]:
res = [x + y for x in [0, 1, 2] for y in [100, 200, 300]] #вложенный генератор
res

[100, 200, 300, 101, 201, 301, 102, 202, 302]

In [4]:
>>> [x + y for x in 'spam' for y in 'SPAM'] #вложенный генератор

['sS',
 'sP',
 'sA',
 'sM',
 'pS',
 'pP',
 'pA',
 'pM',
 'aS',
 'aP',
 'aA',
 'aM',
 'mS',
 'mP',
 'mA',
 'mM']

In [5]:
>>> [(x, y) for x in range(5) if x % 2 == 0 for y in range(5) if y % 2 == 1] #вложенный генератор

[(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]

In [27]:
>>> L = [1, 2, 3, 4, 5]
>>> L = [x + 10 for x in L]        #генератор списка
L

[11, 12, 13, 14, 15]

In [30]:
>>> lines = [line.rstrip() for line in open('test.txt')] #генератор из файла
lines

['Line 1', 'Line 2', 'Line 3', 'Hello', 'Hello', 'Hello', 'Hello', 'Hello']

In [32]:
with open('test.txt') as f:
    s=[line.upper() for line in f]       #генерация из файла
s

['LINE 1\n',
 'LINE 2\n',
 'LINE 3\n',
 'HELLO\n',
 'HELLO\n',
 'HELLO\n',
 'HELLO\n',
 'HELLO\n']

In [36]:
with open('test.txt') as f:
    s=[('H' in line, line[0]) for line in open('test.txt')] #генерация из файла
s

[(False, 'L'),
 (False, 'L'),
 (False, 'L'),
 (True, 'H'),
 (True, 'H'),
 (True, 'H'),
 (True, 'H'),
 (True, 'H')]

In [37]:
with open('test.txt') as f:
    s=[line.upper() for line in f if line[0]=='L']   #условный генератор генерация из файла
s

['LINE 1\n', 'LINE 2\n', 'LINE 3\n']

In [38]:
>>> [x + y for x in 'abc' for y in 'lmn'] #вложенный генератор

['al', 'am', 'an', 'bl', 'bm', 'bn', 'cl', 'cm', 'cn']

In [42]:
list(map(str.upper, open('test.txt'))) #функция map применяет функцию ко всем объектам, map принимает только функцию,
#а не произвольное выражение

['LINE 1\n',
 'LINE 2\n',
 'LINE 3\n',
 'HELLO\n',
 'HELLO\n',
 'HELLO\n',
 'HELLO\n',
 'HELLO\n']

In [51]:
L = ['a', 'b', 'c']
I = iter(L)
list(map(str.upper, I)))#map вызывает заданную функцию к заданному итератору списка ей можно передать только функцию, 
#а не произвольное выражение

['A', 'B', 'C']

In [66]:
{line for line in open('test.txt') if line[0] == 'H'} #генератор множества с условием

{'Hello\n'}

In [62]:
{ix: line for (ix, line) in enumerate(open('test.txt')) if line[0]=='H'} #генератор словаря

{3: 'Hello\n', 4: 'Hello\n', 5: 'Hello\n', 6: 'Hello\n', 7: 'Hello\n'}

# sorted, zip, enumerate, filter, reduce, 

In [79]:
>>> X = (1, 2)
>>> Y = (3, 4)
>>>
>>> list(zip(X, Y)) # Упаковать кортежи: возвратит итерируемый объект
[(1, 3), (2, 4)]
>>>
>>> A, B = zip(*zip(X, Y)) # Распаковать упакованные кортежи!
A

(1, 2)

In [52]:
>>> sorted(open('test.txt')) #функция sorted сортирует элементы итерируемого объекта, функция

['Hello\n',
 'Hello\n',
 'Hello\n',
 'Hello\n',
 'Hello\n',
 'Line 1\n',
 'Line 2\n',
 'Line 3\n']

In [55]:
list(zip(open('test.txt'), open('test.txt'))) #zip объединяет элементы итерируемых объектов, надо оборачивать в list()

[('Line 1\n', 'Line 1\n'),
 ('Line 2\n', 'Line 2\n'),
 ('Line 3\n', 'Line 3\n'),
 ('Hello\n', 'Hello\n'),
 ('Hello\n', 'Hello\n'),
 ('Hello\n', 'Hello\n'),
 ('Hello\n', 'Hello\n'),
 ('Hello\n', 'Hello\n')]

In [56]:
list(enumerate(open('test.txt'))) #функция enumerate создает пары из элементов итерируемых объектов и их позиций

[(0, 'Line 1\n'),
 (1, 'Line 2\n'),
 (2, 'Line 3\n'),
 (3, 'Hello\n'),
 (4, 'Hello\n'),
 (5, 'Hello\n'),
 (6, 'Hello\n'),
 (7, 'Hello\n')]

In [57]:
list(filter(bool, open('test.txt')))#filter отбирает элементы, для которых указанная функция возвращает истинное значение

['Line 1\n',
 'Line 2\n',
 'Line 3\n',
 'Hello\n',
 'Hello\n',
 'Hello\n',
 'Hello\n',
 'Hello\n']

In [58]:
>>> import functools, operator
>>> functools.reduce(operator.add, open('test.txt')) #функция reduce выполняет указанную операцию, объединяя все элементы 
#в итерируемом объекте.

'Line 1\nLine 2\nLine 3\nHello\nHello\nHello\nHello\nHello\n'

# sum, any, all, max, min

In [60]:
print(sum([3, 2, 4, 1, 5, 0])) # sum работает только с числами

print(any(['spam', '', 'ni']))

print(all(['spam', '', 'ni']))

print(max([3, 2, 5, 1, 4]))

print(min([3, 2, 5, 1, 4]))

15
True
False
5
1


In [61]:
print(list(open('test.txt')))             #у файлов есть встроенный итератор, поэтому их можно прямо загружать в функции
print(tuple(open('test.txt')))          #у файлов есть встроенный итератор, поэтому их можно прямо загружать в функции
print("xx".join(open('test.txt')))        #у файлов есть встроенный итератор, поэтому их можно прямо загружать в функции
a, b, c, *d = open('test.txt')            #у файлов есть встроенный итератор, поэтому их можно прямо загружать в функции
print(a,d)
print(set(open('test.txt')))          #у файлов есть встроенный итератор, поэтому их можно прямо загружать в функции

['Line 1\n', 'Line 2\n', 'Line 3\n', 'Hello\n', 'Hello\n', 'Hello\n', 'Hello\n', 'Hello\n']
('Line 1\n', 'Line 2\n', 'Line 3\n', 'Hello\n', 'Hello\n', 'Hello\n', 'Hello\n', 'Hello\n')
Line 1
xxLine 2
xxLine 3
xxHello
xxHello
xxHello
xxHello
xxHello

Line 1
 ['Hello\n', 'Hello\n', 'Hello\n', 'Hello\n', 'Hello\n']
{'Line 1\n', 'Line 3\n', 'Hello\n', 'Line 2\n'}


In [68]:
>>> def f(a, b, c, d): print(a, b, c, d, sep='&')
...
>>> f(1, 2, 3, 4)

1&2&3&4


# знак "*" распаковывает последовательности

In [75]:
def f(a, b, c, d, e, f, g, h): print(a, b, c, d, e, f, g, h, sep='&')
>>> f(*open('test.txt'))                                   # Можно даже выполнить обход строк в файле!

Line 1
&Line 2
&Line 3
&Hello
&Hello
&Hello
&Hello
&Hello



In [77]:
def f(a, b, c, d, e, f, g, h): print(a, b, c, d, e, f, g, h, sep='&')
f(*[1, 2, 3, 4,5,6,7,8]) #знак "*" распаковывает последовательности

1&2&3&4&5&6&7&8


['a', 'b', 'c']
