Iterables y generadores


Una cosa buena de las listas es que se pueden recuperar determinados
elementos por sus índices. Pero ¡esto no siempre es necesario! Una lista de
mil millones de números ocupa mucha memoria. Si solo queremos los
elementos uno cada vez, no hay una buena razón que nos haga conservarlos a
todos. Si solamente terminamos necesitando los primeros elementos, generar
los mil millones es algo tremendamente inútil.
A menudo, todo lo que necesitamos es pasar varias veces por la colección
utilizando for e in. En este caso podemos crear generadores, que se pueden iterar igual que si fueran listas, pero generan sus valores bajo petición.
Una forma de crear generadores es con funciones y con el operador yield:


In [None]:
def generate_range(n):
    i = 0
    while i < n:
        yield i # cada llamada a yield produce un valor del generador
        i += 1


El siguiente bucle consumirá uno a uno los valores a los que se ha
aplicado yield hasta que no quede ninguno:


In [None]:
for i in generate_range(10):
    print(f"i: {i}")

(En realidad, range es bastante perezosa de por sí, así que hacer esto no
tiene ningún sentido).
Con un generador, incluso se puede crear una secuencia infinita:


In [None]:
def natural_numbers():
    """returns 1, 2, 3, ..."""
    n = 1
    while True:
        yield n
        n += 1


Aunque probablemente no deberíamos iterar sobre él sin utilizar algún
tipo de lógica de interrupción.
Truco: La otra cara de la pereza es que solo se puede iterar una única vez por
un generador. Si hace falta pasar varias veces, habrá que volver a crear el
generador cada vez o bien utilizar una lista. Si generar los valores resulta caro,
podría ser una buena razón para utilizar una lista en su lugar.
Una segunda manera de crear generadores es utilizar las comprensiones
envueltas en paréntesis:


In [None]:
evens_below_20 = (i for i in generate_range(20) if i % 2 == 0)


Una “comprensión de generador” como esta no hace nada hasta que se
itera sobre ella (utilizando for o next). Podemos utilizar esto para crear
complicadas líneas de proceso de datos:


In [None]:
# Ninguno de estos cálculos *hace* nada hasta que iteramos
data = natural_numbers()
evens = (x for x in data if x % 2 == 0)
even_squares = (x ** 2 for x in evens)
even_squares_ending_in_six = (x for x in even_squares if x % 10 == 6) # y así sucesivamente


No pocas veces, cuando estemos iterando sobre una lista o un generador,
no querremos solamente los valores, sino también sus índices. Para este caso
habitual, Python ofrece una función enumerate, que convierte valores en
pares (index, value):


In [None]:
names = ["Alice", "Bob", "Charlie", "Debbie"] # no pitónico
for i in range(len(names)):
    print(f"name {i} is {names[i]}") # tampoco pitónico
i = 0
for name in names:
    print(f"name {i} is {names[i]}")
    i += 1 # pitónico
for i, name in enumerate(names):
    print(f"name {i} is {name}")


Utilizaremos mucho esto