# 4. Generatory

to "funkcje", które przechowują swój stan pomiędzy wywołaniami. Generatory możemy wywoływać tylko przy pomocy metody "next".

In [None]:
# generation function
def simple_gen():
    a = 1
    yield a
    a += 1
    yield a
    
# generator
gen = simple_gen()

# first call
print(next(gen))
# second call
print(next(gen))

Zobaczmy typy dla simple_gen & gen:

In [None]:
print(type(simple_gen))
print(type(gen))

Generatory używa się na przykład z pętlami for:

In [None]:
def next_cubes(n):
    i = 1
    while i <= n:
        yield i**3
        i += 1

for i in next_cubes(5):
    print(i)

Generatory to funkcje, które są jednocześnie iteratorami i spełniają tzw. iterator protocol.

1. zwracają siebie w przypadku przekazania ich do funkcji "iter"
2. można na nich wywołać funkcję next
3. wywołują wyjątek StopIteration, gdy kończą swoje działanie

In [None]:
print(gen is iter(gen))
next(gen)

Inny sposób sposób tworzenia iteratora (ale nie generatora):

In [None]:
class myiter(object):
    def __init__(self, v):
        self.v = v
    def __iter__(self):
        return self
    def __next__(self):
        self.v = self.v**2
        if self.v > 1000000000:
            raise StopIteration()
        return self.v
    
for i in myiter(2):
    print(i)

Po co?

In [None]:
import sys
print(sys.getsizeof(range(100)))
print(sys.getsizeof(list(range(100)))) # TODO: change example

Porównajmy zużycie pamięci dla next_cubes & next_cubes2:

In [None]:
def next_cubes2(n):
    for i in list(range(1, n)):  # xrange in python2
        yield i**3

Wyniki:

python gen_while_check.py

11.5625

python gen_range_check.py

42.54296875

## 4.1. Wyrażenia generatorowe

In [None]:
gen = (a**2 for a in range(4))
print(gen)

In [None]:
for i in gen:
    print(i)

## 4.2. Użycie

Nieskończone sekwencje i sekwencje o nieznanej długości.

In [None]:
def fib():
    a, b = 1, 1
    yield b
    yield a
    while True:
        a, b = a + b, a
        yield a

for i in fib():
    if i >= 5:
        break
    print(i)

In [None]:
def dictwalk(items):
    stack = [items]
    while stack:
        it = stack.pop()
        for key in it:
            if type(it[key]) is dict:
                stack.append(it[key])
            else:
                yield key, it[key]
                
                
dct = {"a": 1, "b": {"1a": 11, "1b": 15, "1c": {"11a": 102}},
       "c": 4, "d": {"2a": 12, "2b": {"22a": 150}}}
for k, v in dictwalk(dct):
    print(k, v)
    

Operacje na plikach i katalogach.

In [None]:
import os
print(os.walk('.'))

In [None]:
with open('./long_log') as log:
    result = (int('error' in line) for line in log)
    print(sum(result))

Cooperative multitasking. Corutines.

In [None]:
import time
from collections import deque


class Result(object):
    def __init__(self, v):
        self.v = v
    def __repr__(self):
        return "<Result: {}>".format(self.v)

        
def scheduler(jobs):
    results = []
    not_finished = deque(jobs)
    while not_finished:
        try:
            job = not_finished.pop()
            result, name = next(job)
            if result:
                results.append(result)
            else:
                print("Switched from: {}".format(name))
                not_finished.appendleft(job)
        except StopIteration:
            pass
    return results


def job(name, n, a=3):
    val = 1
    for i in range(n-1):
        val += a * val  + 1
        time.sleep(0.3)
        yield None, name
    yield Result(a * val + 1), name

        
print(scheduler([job("fst", 5), job("sec", 6, 10), job("thr", 2, 100)]))


## 4.3. yield from

In [None]:
import string


def letters():
    for i in string.ascii_letters[:5]:
        yield i


def others():
    signs = ['#', '$', '&', '*', u'ℸ', u'⤮']
    for s in signs:
        yield s


def get_chars():
    yield from letters()
    yield from others()
    
for ch in get_chars():
    print(ch)

In [None]:
type(get_chars())

Po co?
* do strukturyzowania kodu z generatorami (Python 3.3+)

## ZADANIE

Napisz generator, który zwróci wszystkie numery linii z pliku, w których (liniach) występuje słowo 'codilime'.

In [None]:
def get(word='codilime'):
    with open('./long_log'):
        pass

## 4.3. Podsumowanie

* Generatory zachowują stan pomiędzy kolejnymi wywołaniami
* Generatory to iteratory
* Ich użycie wiąże się z mniejszym wykorzystaniem dostępnej pamięci
* Mają wiele zastosowań: przeszukiwanie, nieskończone sekwencje, pipeline'y, lekkie wątki

## 4.4. Czego nie było

* metody send
* bardziej rozbudowanych przykładów współbieżności z użyciem generatorów

http://www.dabeaz.com/coroutines/