# Generators

En python un **generador** (**generator**) es un tipo de _iterable_ más. La principal diferencia con otros _iterables_ es que se trata de una estructura **lazy**, es decir los items agregados (la colección de items iterables) se crean en el momento en que se acceden a ellos. Esto es lo contrario que ocurre, por ejemplo, con una comprensión de listas. En el momento en que se evalua una comprensión de listas, se crean todos sus elementos y se almacenan en memoria.

## Generator Expression

Existe varias formas de crear un _generador_. Una de ellas es definir un expresión de generador, que tiene una sintaxis similar a la de una comprensión de listas:


In [3]:
(x**x for x in [1,2,3])

<generator object <genexpr> at 0x7f13504397b0>

Podemos ver la diferencia entre una compresión de listas (voraz o eager) y una expresión de generador (perezosa o lazy) con un ejemplo. Para construir los items en ambos casos, vamos a usar una función que como efecto colateral imprime el argumento cada vez que de evalua:

In [6]:
def show_and_double(x):
    print(x)
    return x * 2

Si usamos compresión de listas:

In [7]:
[ show_and_double(x) for x in [1,2,3] ]

1
2
3


[2, 4, 6]

Y si usamos una expresión de generador:

In [5]:
( show_and_double(x) for x in [1,2,3] )

<generator object <genexpr> at 0x7f13504392e0>

Como ya hemos dicho, un _generador_ es un _iterable_, y podemos usarlo como tal:

In [9]:
for i in ( show_and_double(x) for x in [1,2,3] ):
    pass

1
2
3


En los ejemplos anteriores, en el caso del _generador_, vemos como en ningún momento se ha construido la colección completa en memoria, y cada item se construye cada vez que avanzamos en el recorrido del iterador.

> Warning: Una vez hemos recorrido los items de una expresión de generador, no podemos volver a recorrerlos. Tal y como se ve en el siguiente ejemplo:

In [10]:
gen = ( show_and_double(x) for x in [1,2,3] )
for i in gen:
    pass
for i in gen:
    pass

1
2
3


## yield

Otra manera de crear un _generador_ es usando la palabra clave _yield_. Si incluimos una expresión _yield_ dentro de una función, automáticamente esa función pasa a devolver un _generador_ sin que tengamos que hacer nada más, el compilador se ocupa.

In [11]:
def foo():
    yield 1
    yield 2
    yield 3
foo()

<generator object foo at 0x7f1350468350>

Dentro de la función podemos tener cualquier código válido. El código no se ejecutará hasta que comenzemos a recorrer el _generador_. Cada vez que hacemos un _next_, se ejecuta el código de la función hasta encontrar una expresión `yield` y devuelve su resultado. En el siguiente _next_ la función continúa la ejecución después del último yield. El recorrido del iterador termina cuando termina el código de la función.

In [13]:
gen = foo()
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))

1
2
3


StopIteration: 

In [15]:
for i in foo():
    print(i)

1
2
3


Más ejemplos:

In [16]:
import random
def lottery():
    for i in range(6):
        yield random.randint(1, 40)
    yield random.randint(1,15)
    
for n in lottery():
    print(n)

40
23
3
18
3
16
11


Puesto que los _generadores_ son _lazy_, es posible crear una lista infinita:

In [19]:
def infinita():
    while True:
        yield random.randint(1,13)
        
# No vamos a intentar recorrer una lista infinita

También es posible, dentro de una _función generadora_ incluir el recorrido de otro _iterable_:

In [18]:
def bar():
    yield 'a'
    yield from foo()
    
for x in bar():
    print(x)

a
1
2
3
