# Iteratores y generadores

En esta nota, veremos la diferencia entre iteración y generación en Python y cómo construir nuestros propios generadores con la declaración de *yield* (_producir_). Los generadores nos permiten generar resultados a medida que avanzamos, en lugar de mantener todo en la memoria de la computadora.

Hemos tratado este tema en el pasado al analizar ciertas funciones incorporadas de Python como **range()**, **map()** y **filter()**.

Hemos aprendido cómo crear funciones con <code> def </code> y la declaración <code> return </code>. Las funciones del generador nos permiten escribir una función que puede devolver un valor y luego reanudar para continuar donde lo dejó. Este tipo de función es un generador en Python, lo que nos permite generar una secuencia de valores a lo largo del tiempo. La principal diferencia en la sintaxis será el uso de una declaración de <code> yield </code>.

En la mayoría de sus aspectos, una función generadora aparecerá muy similar a una función normal. La principal diferencia es que cuando se compila una función de generador, se convierten en un objeto que admite un protocolo de iteración. Eso significa que cuando se les llama en un código, en realidad no devuelven un valor y luego se sale de ella. En cambio, las funciones generadoras suspenderán y reanudarán automáticamente su ejecución alrededor del último punto de generación. La principal ventaja aquí es que, en lugar de tener que calcular una serie completa de valores por adelantado, el generador calcula un valor y luego suspende su actividad en espera de la siguiente instrucción. Esta característica se conoce como *suspensión de estado* (_state suspension_).

Para comenzar a comprender mejor los generadores, veamos cómo podemos crear algunos.

In [1]:
# Función generadora para calcular el cubo de una secuencia de números hasta un número N
def gencubos(n):
    for numero in range(n):
        yield numero**3

In [2]:
for x in gencubos(10):
    print(x)

0
1
8
27
64
125
216
343
512
729


Ahora, ya que tenemos una función generadora, no tenemos que mantener un seguimiento de cada cubo que creamos.

Los generadores son mejores para calcular grandes conjuntos de resultados (especialmente en cálculos que involucran bucles) en casos donde no queremos utilizar la memoria de la computadora para utilizar resultados al mismo tiempo.

Hagamos otro ejemplo donde creemos números de la [serie de Fibonacci](https://es.wikipedia.org/wiki/Sucesi%C3%B3n_de_Fibonacci).

In [3]:
def genfibon(n):
    """
    Generar una serie de Fibonacci hasta un número n
    """
    a = 1
    b = 1
    for i in range(n):
        yield a
        a,b = b,a+b

In [4]:
for numero in genfibon(10):
    print(numero)

1
1
2
3
5
8
13
21
34
55


¿Qué pasaría si esta fuera una función normal? ¿qué aspecto tendría?

In [5]:
def fibon(n):
    a = 1
    b = 1
    output = []
    
    for i in range(n):
        output.append(a)
        a,b = b,a+b
        
    return output

In [6]:
fibon(10)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

Debemos tener en cuenta que si llamamos un valor enorme de n (digamos, 100000), la segunda función tendrá que realizar un seguimiento de cada resultado individual, cuando en nuestro caso solo nos importa el resultado anterior para generar el siguiente.

## next() e iter()

Unas funciones importantes para comprender completamente los generadores son las funciones next() y la función iter().

La función next() nos permite acceder al siguiente elemento en una secuencia. Veamos un ejemplo.

In [8]:
def simple_gen():
    for x in range(3):
        yield x

In [9]:
# Llamemos a la funcion simple_gen()
g = simple_gen()

In [10]:
print(next(g))

0


In [11]:
print(next(g))

1


In [12]:
print(next(g))

2


In [13]:
print(next(g))

StopIteration: 

Después de producir todos los valores, next () provocó un error de tipo `StopIteration`. Lo que nos informa este error es que todos los valores han sido producidos ya.

Es posible que te pregunte por qué no obtenemos este error al utilizar un bucle for. Esto es porque un bucle for detecta automáticamente este error y detiene la llamada de next().

Ahora veamos cómo usar iter(). Recuerdemos que las cadenas son iterables:

In [14]:
s = 'hola Python'

#Iterar sobre los caracteres en la cadena
for let in s:
    print(let)

h
o
l
a
 
P
y
t
h
o
n


¡Pero eso no significa que la cadena sea un * iterador *! Podemos verificar esto con la función next():

In [15]:
next(s)

TypeError: 'str' object is not an iterator

Interesantemente, esto significa que las cadenas admite iteración, pero no podemos iterar directamente sobre él como podríamos con una función generador. La función iter() nos permite hacer precisamente eso.

In [16]:
s_iter = iter(s)

In [17]:
next(s_iter)

'h'

In [18]:
next(s_iter)

'o'

Ahora ya sabemo cómo convertir objetos iterables **en** iteradores.

La principal conclusión de esta nota es que el uso de la palabra clave **yield** en una función hará que la función se convierta en un generador. Este cambio puede ahorrarnos el uso de mucha memoria. Para más información sobre este tema, los siguientes recursos son buenos:

[Respuesta en Stack Overflow](http://stackoverflow.com/questions/1756096/understanding-generators-in-python)

[Otra respuesta en StackOverflow](http://stackoverflow.com/questions/231767/what-does-the-yield-keyword-do-in-python)