# Tema 1.4: Iteradores y Generadores

## 1. Secuencias iterables e Iteradores

En Python, cualquier objeto sobre el que se puede "aplicar" un bucle `for` es un [iterable](https://docs.python.org/es/3/glossary.html#term-iterable) (p.e. listas, tuplas, diccionarios, strings).

In [1]:
print("Recorrido lista con for:")
lista = [1, 2, 3]
for elemento in lista:
    print(elemento)

print("\nRecorrido tupla con for:")
tupla = (1, "Dos", 3.0)
for elemento in tupla:
    print(elemento)

print("\nRecorrido cadena con for:")
cadena = "Bon dia!"
for caracter in cadena:
    print(caracter)

Recorrido lista con for:
1
2
3

Recorrido tupla con for:
1
Dos
3.0

Recorrido cadena con for:
B
o
n
 
d
i
a
!


Internamente, el bucle `for` invoca la función [`iter()`](https://docs.python.org/es/3/library/functions.html#iter) sobre el iterable, lo que devuelve un [**iterador**](https://docs.python.org/es/3/glossary.html#term-iterator). 

Un iterador es un objeto capaz de generar dinámicamente, bajo demanda, una secuencia de elementos. 

En ese sentido, es un tipo de objeto que "recuerda" en qué posición está de la secuencia generada, y sabe cómo generar/obtener el siguiente elemento. 

Es por ello que es una herramienta muy eficiente en términos de consumo de memoria para recorrer secuencias.

Para obtener el siguiente elemento de un iterador o secuencia iterable, debemos usar la función incorporada [`next()`](https://docs.python.org/es/3/library/functions.html#next), pasándole el iterador como argumento.

Cuando se agota el iterable, el iterador lanza una excepción `StopIteration`.

*(Nota: en el tema 2 aprenderemos a crear objetos iterables)*

In [2]:
iterador = iter(lista)
print(f"type(): {type(iterador)}")

print("Recorrido de lista con iterador:")
print(f"next(): {next(iterador)}")
print(f"next(): {next(iterador)}")
print(f"next(): {next(iterador)}")

# La siguiente petición de next() lanza una excepción StopIteration, la capturamos con try/except
try:
    print(f"next(): {next(iterador)}")
except StopIteration:
    print("Excepción StopIteration capturada! Es decir: no quedan más elementos en el iterador")


type(): <class 'list_iterator'>
Recorrido de lista con iterador:
next(): 1
next(): 2
next(): 3
Excepción StopIteration capturada! Es decir: no quedan más elementos en el iterador


## 2. Generadores

Los generadores son una herramienta simple y poderosa para crear objetos iteradores, si bien tienen entidad propia como objetos generadores. 

Son funciones que usan la sentencia **`yield`** en su cuerpo para generar una secuencia iterable. Dichas funciones se convierten en objetos generadores únicamente cuando son invocadas. 

Cuando se invoca una función generadora, esta no se ejecuta, sino que devuelve un **objeto generador**. 

In [3]:
# función generadora
def contador_hasta(n):
    i = 1
    while i <= n:
        yield i
        i += 1

print(f"Tipo de la función sin invocar: {type(contador_hasta)}")
print(f"Tipo de retornado por la función tras ser invocada: {type(contador_hasta(3))}")

Tipo de la función sin invocar: <class 'function'>
Tipo de retornado por la función tras ser invocada: <class 'generator'>


Cada vez que se llama la función incorporada **`next()`** pasándole el objeto generador como parámetro, la función generadora se ejecuta hasta que se encuentra con una sentencia **`yield`**, donde pausa su ejecución y devuelve el valor que acompaña a la sentencia **`yield`**.

Cuando la función generadora finaliza, lanza una excepción `StopIteration` para indicar que ya no se generarán más elementos. 

In [4]:
generador_hasta_3 = contador_hasta(3)

print(f"next(): {next(generador_hasta_3)}")
print(f"next(): {next(generador_hasta_3)}")
print(f"next(): {next(generador_hasta_3)}")

# Dado que el generador ha llegado al final, al intentar obtener el siguiente elemento se lanza una excepción StopIteration
try:
    print(next(generador_hasta_3))
except StopIteration:
    print("StopIteration! Hemos alcanzado el final del generador")

next(): 1
next(): 2
next(): 3
StopIteration! Hemos alcanzado el final del generador


Las funciones generadoras se usan típicamente como secuencia iterable en un bucle for:

In [5]:
print(f"\nBucle for sobre función generadora:")

for i in contador_hasta(3):
    print(i)


Bucle for sobre función generadora:
1
2
3


También podemos desplegar ("convertir") una función generadora en una lista o tupla:

In [6]:
l = list(contador_hasta(10))
print(l)
t = tuple(contador_hasta(10))
print(t)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)


## 3. Expresiones Generadoras

Son similares a las listas por comprensión, pero usan paréntesis `()`. 

Por si no las conoces, las listas por comprensión nos permiten crear una secuencia de elementos por repetición en una sola línea de código. Es un mecanismo muy *pythonic*. 

Es decir, el siguiente bloque de código, que genera una lista con los cuadrados de los diez enteros que van del 0 al 9:

In [2]:
cuadrados = []
for x in range(10):
    cuadrados.append(x**2)
print(cuadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Se puede reescribir en forma de lista de comprensión así:

In [3]:
cuadrados = [ x**2 for x in range(10) ]
print(cuadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Bien, volvamos a las expresiones generadoras.

La gran diferencia de estas con las listas por comprensión es que **no construyen la lista en memoria**, sino que generan los valores bajo demanda, uno a uno.

Son **mucho más eficientes en memoria** para secuencias grandes.

Consideremos una lista por comprensión para los primeros 10000 cuadrados:

In [4]:
import sys

#### Lista por comprensión: ocupa memoria para todos los elementos
lista_cuadrados = [x**2 for x in range(10000)]

print(f"Tamaño lista: {sys.getsizeof(lista_cuadrados)} bytes")

iterador = iter(lista_cuadrados)
print(f"Primer elemento (lista): {next(iterador)}")
print(f"Segundo elemento (lista): {next(iterador)}")
print(f"Tercer elemento (lista): {next(iterador)}")
print(f"Cuarto elemento (lista): {next(iterador)}")

Tamaño lista: 85176 bytes
Primer elemento (lista): 0
Segundo elemento (lista): 1
Tercer elemento (lista): 4
Cuarto elemento (lista): 9


Ahora vamos a considerar una expresión generadora equivalente, con la misma funcionalidad pero con una reducción del 99.8% de consumo de memoria:

In [8]:
#### Generador: ocupa memoria mínima
gen_cuadrados = (x**2 for x in range(10000))

reduccion_memoria = (sys.getsizeof(lista_cuadrados) - \
                     sys.getsizeof(gen_cuadrados)) \
                    / sys.getsizeof(lista_cuadrados) * 100
print(f"\nTamaño generador: {sys.getsizeof(gen_cuadrados)} bytes (-{reduccion_memoria:.1f}%)")

iterador = iter(gen_cuadrados)
print(f"Primer elemento (generador): {next(iterador)}")
print(f"Segundo elemento (generador): {next(iterador)}")
print(f"Tercer elemento (generador): {next(iterador)}")
print(f"Cuarto elemento (generador): {next(iterador)}")


Tamaño generador: 200 bytes (-99.8%)
Primer elemento (generador): 0
Segundo elemento (generador): 1
Tercer elemento (generador): 4
Cuarto elemento (generador): 9
