---
title: "5 - Generadores üß©"
toc: true
---

## Introducci√≥n

En este cap√≠tulo vamos a introducirnos en los generadores, tanto en las funciones como en las expresiones generadoras.
A diferencia de las funciones regulares, que devuelven un resultado con `return`, los generadores no devuelven un √∫nico resultado, sino que van entregando valores de a uno a medida que se lo solicita.
Cada vez que se entrega un valor, la ejecuci√≥n queda en pausa y se conserva el estado de las variables, de modo que puede reanudarse m√°s adelante.
De este modo, los generadores resultan ideales para definir iteradores y trabajar con grandes vol√∫menes de datos sin necesidad de almacenarlos al mismo tiempo en memoria.

## Funciones generadoras

Una funci√≥n generadora se define igual que una funci√≥n com√∫n con `def`, pero en lugar de devolver un valor con `return`, lo hace con `yield`.

Cuando se ejecuta una funci√≥n generadora, no se ejecuta el c√≥digo en su cuerpo de manera inmediata ni se obtiene un resultado.
En cambio, se obtiene un **generador** que luego puede **entregar** valores.

In [1]:
def gen():
    yield "¬°Resultado!"

g = gen()
g

<generator object gen at 0x7fec067461f0>

Como los generadores son **iteradores** (ver [Iterables e iteradores](./05_generadores.ipynb#sec-iteradores)), se puede usar `next` para obtener el siguiente valor de manera manual:

In [2]:
next(g)

'¬°Resultado!'

Este primer ejemplo es demasiado simple para apreciar la verdadera utilidad de los generadores.
Si solo necesit√°ramos devolver un √∫nico valor, bastar√≠a con usar una funci√≥n com√∫n.

La ventaja de los generadores est√° en que pueden **entregar varios valores de a uno**, a medida que se los solicita, mientras conservan el estado de las variables.

Veamos ahora una segunda funci√≥n generadora, esta vez con dos instrucciones `yield` en lugar de una.
En la primera llamada a `next`, obtenemos `"Primer resultado"`.

In [3]:
def gen():
    yield "Primer resultado"
    yield "Segundo resultado"

g = gen()
next(g)

'Primer resultado'

Y en la segunda llamada a `next` el generador entrega el segundo valor: `"Segundo resultado"`.

In [4]:
next(g)

'Segundo resultado'

En la primera llamada a `next`, la funci√≥n se ejecuta hasta llegar a la primera instrucci√≥n `yield`.
All√≠ el generador devuelve un valor y suspende su ejecuci√≥n.
Con la segunda llamada, la ejecuci√≥n se reanuda desde ese punto y contin√∫a hasta encontrar el siguiente `yield`, entregando otro valor.

Ahora bien, ¬øqu√© ocurre si llamamos a `next` cuando el generador ya entreg√≥ todos los valores disponibles?

```python
next(g)
```
```cmd
    next(g)
    ~~~~^^^
StopIteration
```

Una vez que un generador se agota, cualquier llamada adicional a `next` elevar√° la excepci√≥n `StopIteration`, que se√±ala que ya no quedan valores por producir.

Para observar con m√°s detalle c√≥mo funciona la ejecuci√≥n y suspensi√≥n en los generadores, vamos a implementar una funci√≥n que mantiene el estado de una variable num√©rica e imprime un mensaje justo antes de cada `yield`.

In [6]:
def generador(x):
    print("Recib√≠ el valor", x)

    x = x + 18
    print("Entrego el valor", x)
    yield x

    x = x - 5
    print("Esto una entrega siguiente, devuelvo el valor", x)
    yield x

    print("Este mensaje est√° bien al final")

g = generador(7)

Como se puede observar, la ejecuci√≥n de la funci√≥n generadora no imprimi√≥ ning√∫n mensaje, ya que esto no ejecuta el cuerpo de la funci√≥n.
Reci√©n al pedir el primer valor se ejecutan los dos `print` previos al primer `yield`. Adem√°s, el valor inicial `7` se incrementa en `18` y luego es devuelto.

In [7]:
next(g)

Recib√≠ el valor 7
Entrego el valor 25


25

En la segunda llamada a `next(g)` se imprime un mensaje y se entrega el valor `25 - 5 = 20`.
Esto muestra que el generador conserva el estado de las variables: en lugar de usar el valor original de `x`, utiliza el valor actualizado en la entrega anterior.

In [8]:
next(g)

Esto una entrega siguiente, devuelvo el valor 20


20

Sin embargo, el `print` al final, debajo del √∫ltimo `yield`, a√∫n no se ejecut√≥. Para eso, usamos `next(g)` nuevamente.

```python
next(g)
```
```cmd
Este mensaje est√° bien al final

    next(g)
    ~~~~^^^
StopIteration
```

Como no hay ning√∫n otro valor por entregar, se imprime el mensaje y luego se obtiene la excepci√≥n `StopIteration`.

### Ejemplo 1: Secuencia de n√∫meros naturales

Los generadores tambi√©n permiten crear secuencias infinitas.
Para ello basta con escribir un bucle infinito dentro de la funci√≥n generadora.
Esto no representa un problema, ya que el generador produce un valor a la vez, √∫nicamente cuando se le solicita.

In [10]:
def numeros_naturales():
    n = 0
    while True:
        yield n
        n = n + 1

secuencia = numeros_naturales()

Luego, pedimos los valores de a uno:

In [11]:
print(next(secuencia))
print(next(secuencia))
print(next(secuencia))
print(next(secuencia))
print(next(secuencia))

0
1
2
3
4


Vale la pena notar que un generador no tiene longitud, ya que podr√≠a ser infinito, ni permite acceder a sus elementos por √≠ndice.
Solo sabe c√≥mo producir el pr√≥ximo valor, sin conocer de antemano cu√°ntos quedan por generar.

```python
len(secuencia)
```
```cmd
    len(secuencia)
    ~~~^^^^^^^^^^
TypeError: object of type 'generator' has no len()
```


```python
secuencia[0]
```
```cmd
    secuencia[0]
    ~~~~~~~~~^^^
TypeError: 'generator' object is not subscriptable
```

Como los generadores son iteradores, podemos recorrerlos con un bucle `for`.
En el caso de secuencias infinitas, es necesario usar un `break` para evitar que el bucle nunca termine.

In [25]:
i = 0
for n in secuencia:
    print(n)
    i += 1
    if i >= 5:
        break

5
6
7
8
9


Si nuestro √∫nico objetivo es recorrer los elementos del generador, podemos inicializarlo directamente en el bucle `for`.

In [26]:
for n in numeros_naturales():
    print(n)
    if n >= 7:
        break

0
1
2
3
4
5
6
7


### Ejemplo 2: Secuencia de Fibonacci

Las secuencias infinitas no se limitan a los n√∫meros naturales.
Como los generadores conservan el estado de las variables dentro de la funci√≥n, tambi√©n pueden usarse para producir otras secuencias, como la de Fibonacci.

$$
F_n =
\begin{cases}
0 & \text{si } n = 0 \\
1 & \text{si } n = 1 \\
F_{n-1} + F_{n - 2} & \text{si } n \ge 2 \\
\end{cases}
$$

In [27]:
def fibonacci():
    a = 0
    b = 1
    while True:
        yield a
        a, b = b, a + b

Si queremos los primeros 10 n√∫meros de la secuencia, podemos utilizar un bucle `for` que ejecuta `next(g)` 10 veces seguidas.

In [28]:
g = fibonacci()
for _ in range(10):
    print(next(g))

0
1
1
2
3
5
8
13
21
34


Al volver a pedir un nuevo valor a nuestro generador, este contin√∫a avanzando en la secuencia de Fibonacci.

In [29]:
next(g)

55

In [30]:
next(g)

89

### Ejemplo 3: Promedio acumulado

En este ejemplo se muestra un generador que procesa una secuencia num√©rica y va devolviendo el promedio acumulado a medida que avanza.

Como los valores se producen bajo demanda, en memoria solo se conserva la secuencia original y el √∫ltimo promedio calculado.

In [31]:
def promedio_acumulado(numeros):
    numerador = 0
    for i, numero in enumerate(numeros):
        numerador += numero
        yield numerador / (i + 1)

valores = [2, 4, 9, 1, 7, 11] # Supongamos una lista muy grande de n√∫meros

for m in promedio_acumulado(valores):
    print(f"Promedio acumulado: {m:.2f}")

Promedio acumulado: 2.00
Promedio acumulado: 3.00
Promedio acumulado: 5.00
Promedio acumulado: 4.00
Promedio acumulado: 4.60
Promedio acumulado: 5.67


## Expresiones generadoras

Las expresiones generadoras, del ingl√©s _generator expressions_, proveen una manera concisa para construir generadores.
Se parecen a las _list comprehensions_, pero usan par√©ntesis en vez de corchetes.

Supongamos una lista de n√∫meros cualquiera y que usamos una _list comprehension_ para obtener el triple de cada n√∫mero.

In [32]:
numeros = [3, 14, 2, 7, 1, 28]
triples = [n * 3 for n in numeros]

print(numeros)
print(triples)

[3, 14, 2, 7, 1, 28]
[9, 42, 6, 21, 3, 84]


La expresi√≥n generadora equivalente es la siguiente:

In [33]:
triples = (n * 3 for n in numeros)
triples

<generator object <genexpr> at 0x7fec045f4110>

Como todo generador, implementa la estrategia de evaluaci√≥n perezosa.
Esto quiere decir que el triple de cada n√∫mero se calcula justo en el momento en que se solicita, no antes. 

As√≠, podemos obtener los valores mediante un bucle:

In [34]:
for n in triples:
    print(n)

9
42
6
21
3
84


Un generador creado con una expresi√≥n generadora es equivalente a uno definido con una funci√≥n generadora.
En ambos casos, si se intenta obtener un valor de un generador ya agotado, se producir√° un error.

```python
next(triples)
```
```cmd
    next(triples)
    ~~~~^^^^^^^^^
StopIteration
```

Y al intentar obtener una lista a partir de un generador agotado, obtendremos una lista vac√≠a.

In [36]:
list(triples)

[]

Adem√°s de ser perezosos, los generadores son de √∫nico uso.
Sus valores se generan a medida que se solicitan y no se guardan en memoria, de modo que, una vez consumidos, no es posible volver a iterarlos.

Esta aparente limitaci√≥n es en realidad una ventaja.
A diferencia de una lista, que construye y guarda todos sus elementos en memoria, un generador solo define una receta para producirlos cuando se necesiten.
En el siguiente ejemplo se muestra c√≥mo esto impacta en el consumo de memoria frente a una lista.

In [37]:
import sys

# Enteros divisibles por 3 o 5 entre 1 y 10,000,000
lista = [n for n in range(1, 10_000_001) if n % 3 == 0 or n % 5 == 0]
genexpr = (n for n in range(1, 10_000_001) if n % 3 == 0 or n % 5 == 0)

print(sys.getsizeof(lista))   # bytes
print(sys.getsizeof(genexpr)) # bytes

39064728
200


Y a partir de ambos objetos se puede computar, por ejemplo, la suma.

In [38]:
sum(lista), sum(genexpr)

(23333341666668, 23333341666668)

En resumen, mientras que una **lista** es una **colecci√≥n de valores**, un **generador** es una **receta para producir valores**.

## Iterables e iteradores {#sec-iteradores}

A lo largo de este cap√≠tulo dijimos varias veces que **los generadores son iteradores**, aunque todav√≠a no definimos con precisi√≥n qu√© significa eso.

Lo que s√≠ sabemos es que un objeto es **iterable** cuando puede recorrerse con un bucle `for`.
En Python, las listas, las cadenas y los diccionarios son ejemplos de objetos iterables, por lo que los siguientes bloques de c√≥digo funcionan sin problemas:

```python
for i in [10, 55, 2]:
    print(i + 5)

for c in "palabras":
    print(c.upper())

for k in {"nombre": "Juan", "apellido": "P√©rez"}:
    print(k)
```

Como ya vimos que una lista se puede recorrer con un bucle, podr√≠amos preguntarnos si tambi√©n es posible usar la funci√≥n `next` para obtener su siguiente elemento.

In [39]:
nums = [-10, 0, 10]

```python
next(nums)
```
```cmd
    next(nums)
    ~~~~^^^^^^
TypeError: 'list' object is not an iterator
```

Sin embargo, al hacerlo obtenemos un `TypeError` que indica que la lista no es un **iterador**.
Lo mismo ocurre si intentamos usar `next` directamente con una cadena o un diccionario.

```python
next("palabra")
```
```cmd
    next("palabra")
    ~~~~^^^^^^^^^^^
TypeError: 'str' object is not an iterator
```

```python
next({"nombre": "Juan", "apellido": "P√©rez"})
```
```cmd
    next({"nombre": "Juan", "apellido": "P√©rez"})
    ~~~~^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
TypeError: 'dict' object is not an iterator
```

El error que aparece al usar `next` sobre una lista, una cadena o un diccionario muestra que no basta con que un objeto sea iterable para poder aplicarle `next` directamente.

Lo que sucede, es que, en realidad, nuestra definici√≥n inicial de iterable era incompleta: un objeto es **iterable** cuando puede generar un **iterador** a partir de √©l.

Luego, es el iterador que conoce c√≥mo producir los valores uno a uno y, por eso, es sobre el iterador (y no sobre el iterable) que Python puede aplicar `next` para avanzar en la secuencia.

Para crear un iterador a partir de un iterable usamos `iter`.

In [40]:
iterador = iter(nums)
iterador

<list_iterator at 0x7fec045de6b0>

Y ahora s√≠ es posible avanzar a trav√©s de los elementos de la lista original:

In [41]:
next(iterador)

-10

In [42]:
next(iterador)

0

In [43]:
next(iterador)

10

```python
next(iterador)
```
```cmd
    next(iterador)
    ~~~~^^^^^^^^^^
StopIteration
```

Por √∫ltimo, vale la pena se√±alar que los iteradores solo pueden construirse a partir de objetos **iterables**.
Por ejemplo, un n√∫mero entero no es iterable, por lo que no es posible obtener un iterador a partir de √©l.

```python
iter(10)
```
```cmd
    iter(10)
    ~~~~^^^^
TypeError: 'int' object is not iterable
```

En resumen, en Python **solo se puede iterar sobre iteradores**.
Un objeto es **iterable** cuando puede generar un iterador a partir de √©l, y es este √∫ltimo el que sabe c√≥mo devolver los elementos uno a uno mediante la funci√≥n `next`.
Cuando ya no quedan m√°s valores por producir, el iterador eleva la excepci√≥n `StopIteration`.

Los **generadores** son un caso particular de iteradores: producen sus valores bajo demanda y mantienen el estado entre llamadas.

Finalmente, al usar un bucle `for` con un iterable, todo este mecanismo ocurre de forma autom√°tica: Python crea el iterador por nosotros y se encarga de avanzar en la secuencia hasta agotarla.