# Notebook creado por Francisco Solís

# Generadores y Corrutinas (Generators and Corroutines)

## Tabla de contenidos
- [Como crear generadores](#id1)
<a href='#id1'></a>

- [Generadores infinitos](#id2)
<a href='#id2'></a>

- [Generadores envolviendo iterables](#id3)
<a href='#id3'></a>

- [Comprehensions de generadores](#id4)
<a href='#id4'></a>

Los generadores son funciones que se comportan como iteradores generando los valores que retornan uno a uno.

Un generador ocupa `yield` para retornar un único valor cuando se le es solicitado. El efecto lateral es que los generadores pueden ser infinitamente largos porque se puede seguir solicitando por siempre.

Hay una variación en la sintaxís de los generadores que crean corrutinas. Las corrutinas son funciones que permiten el multitasking sin requerir múltiples threads o procesos. 

Mientras que los generadores pueden retornar values a quien se lo solicita basado en los argumentos iniciales, las corrutinas permiten dos formas de comunicación con la función que la llama mientras corre. La implementación de corrutinas en Python es a través del módulo `asyncio`.

Si las corrutinas funcionan para lo que usted necesita, pueden ofrecer una enorme mejora en el rendimiento.

## Generadores

A continuación se presentan las principales ventajas y desventajas de los generadores.

**Ventajas**

- Los generadores son usualmente más simples que escribir que una función que genera listas. Sólo se necesita el valor `yield`.
- Los ítems pueden ser procesados uno a la vez, así que generalmente no hay necesidad de mantener toda la lista en la memoria.
- Los resultados pueden depender de factores externos. Sólo se genera el valor cuando es solicitado.
- Los generadores son "flojos". Esto quiere decir, que si se usan solo los diez primeros resultados de un generador, el resto no va a ser calculado.

**Desventajas**
- Los resultados sólo están disponibles una vez. Después de procesar los resultados de un generador, no se pueden usar de nuevo.
- El tamaño es desconocido, incluso puede ser infinito.
- No es posible usar slices, así que mi_generador[3:10] no va a funcionar. Se puede usar itertools.islice para esto.
- No se puede indexar generadores, así que mi_generador[3] no funcionará.

<a id='id1'></a>

## Como crear generadores

El generador más simple que se puede crear es una función que contiene una declaración `yield` en vez de `return`. La diferencia principal con funciones regulares que contienen un `return`, es que se pueden tener muchos `yield` en la función.

In [2]:
def mi_generador():
    yield 5
    yield "Buenos días"
    yield 25
    return "Hemos llegado al final"

resultado = mi_generador()

In [5]:
resultado

<generator object mi_generador at 0x000002A0240E7900>

In [6]:
len(resultado)

TypeError: object of type 'generator' has no len()

In [8]:
resultado[:]

TypeError: 'generator' object is not subscriptable

In [9]:
list(resultado)

[5, 'Buenos días', 25]

In [10]:
list(resultado)

[]

Como se puede observar, no se obtiene mucha información valiosa al con `repr()`, `len()` o slices. Además, utilizar `list()` una segunda oportunidad no funciona porque el generador ya está "cansado".

Además, puede que haya notado que el valor de `return` pareciera que ha desaparecido. No es el caso, el valor de return todavía se puede utilizar, pero como el valor para la excepción `StopIteration` producidad por el generador para indicar que está "exhausto".

In [11]:
def segundo_generador():
    yield "Algún valor"
    return "El fin del generador"

resultado = segundo_generador()

In [12]:
next(resultado)

'Algún valor'

In [13]:
next(resultado)

StopIteration: El fin del generador

Mencionar que nosotros podemos manejar la excepción, de `StopIteration`, de la siguiente manera (por ejemplo).

In [19]:
def flojo():
    print("Antes del yield statement")
    yield "He llegado a yield"
    print("Después del yield statement")
    
generador = flojo()

In [20]:
next(generador)

Antes del yield statement


'He llegado a yield'

In [21]:
try:
    next(generador)
except StopIteration:
    print("He llegado al final, pues se ha producido una excepción del tipo StopIteration")

Después del yield statement
He llegado al final, pues se ha producido una excepción del tipo StopIteration


In [22]:
for item in flojo():
    print(item)

Antes del yield statement
He llegado a yield
Después del yield statement


Para el correcto manejo de los generadores, siempre tiene que manejar usted la excepción `StopIteration`, o usar un loop u otra estructura que maneje `StopIteration` de forma implícita.

<a id='id2'></a>

## Creando generadores infinitos

Crear un generador sin fin es sencillo. En vez de tener `yield` <valor> como en las funciones previas, ocupamos `yield` dentro de un loop infinito, así podemos hacer un generador infinito.

In [25]:
def contar(start=0, steps=1, stop= None):
    n = start
   
    while stop is not None and n < stop:
        yield n
        n += steps
        
list(contar(5, 1, 10))

[5, 6, 7, 8, 9]

**Debido a la naturaleza infinita de los generadores, se requiere precaución. Sin la variable stop, hacer list(contar()) puede resultar en un loop infinito que puede resultar en quedarse sin memoria de forma sumamente rápida.**

Lo anterior es en esencia, un for loop de toda la vida, la principal diferencia entre esto y el método regular de retornar una lista de items is que el `yield` statement retorna un item a la vez, lo que significa que solo se necesita calcular el ítem solicitado y no se deben de mantener todos los resultados en la memoria.

<a id='id3'></a>

## Generadores envolviendo iterables

El verdadero poder de los generadores se produce cuando se utilizan con otros iterables.

In [26]:
def cuadrado(iterable):
    for i in iterable:
        yield i ** 2
        
list(cuadrado(range(6)))

[0, 1, 4, 9, 16, 25]

Debido a que los generadores son iterables, se pueden combinar "envolviéndolos" tantas veces como usted desee.

In [28]:
def impar(iterable):
    for i in iterable:
        if i % 2:
            yield i
            
def cuadrado(iterable):
    for i in iterable:
        yield i ** 2
        

list(cuadrado(impar(range(10))))

[1, 9, 25, 49, 81]

Para entender lo que sucedió, debemos ir desde el interior hasta el exterior.
- `range(10)` genera 10 números
- El generador `impar()` filtra los valores, así solo retorna los números impares.
- El generador `cuadrado()` eleva a la potencia de dos los números impares.

El verdadero poder de combinar es que los generadores harán algo únicamente cuando se les pida que lo hagan. Si solicitamos un solo valor con `next()` en vez de `list()`, solo la primera iteración en el loop en `cuadrado()` será ejecutada.

<a id='id4'></a>

## Comprehensions de generadores

La premisa básica es idéntica a las list comprehensions, pero se usan paréntesis en vez de paréntesis cuadrados.

In [30]:
cuadrados = (x ** 2 for x in range(5))

In [31]:
cuadrados

<generator object <genexpr> at 0x000002A025B6EB30>

In [32]:
list(cuadrados)

[0, 1, 4, 9, 16]

Lo anterior es sumamente útil cuando se necesitan "envolver" los resultados de un generador distinto, pues solo calcula los valores que se le pide.

In [34]:
import itertools

resultado = itertools.count()
impar = (x for x in resultado if x % 2)
slices_impares = itertools.islice(impar, 5)
list(slices_impares)

[1, 3, 5, 7, 9]

In [40]:
import itertools

resultado = itertools.count()
slice_resultados = itertools.islice(resultado, 5)
impar = (x for x in slice_resultados if x % 2)
list(impar)

[1, 3]

Como puede notar, el orden de las operaciones es sumamente importate, pues la función itertools.islice() hace slice al resultado en tal punto, no el generador original.

## Generadores e iteradores basados en clases

El crear generadores utilizando clases, puede ser beneficioso para generadores más complejos donde se requiere recordar el estado o donde se puede usar herencia.

A continuación se creará una clase que intenta imitar el comportamiento de `itertools.count()` con un parámetro de stop.

In [41]:
class ContadorGenerator:
    def __init__(self, start=0, step=1, stop=None):
        self.start = start
        self.step = step
        self.stop = stop
    
    
    def __iter__(self):
        i = self.start
        
        while self.stop is None or i < self.stop:
            yield i
            i += self.step
            

In [43]:
list(ContadorGenerator(start=2.5, step=0.5, stop=5))

[2.5, 3.0, 3.5, 4.0, 4.5]

A continuación se modificará un poco la clase generador para convertirla en un iterador con más características.

In [46]:
class ContadorIterador:
    def __init__(self, start = 0, step = 1, stop = None):
        self.i = start
        self.start = start
        self.step = step
        self.stop = stop
    
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.stop is not None and self.i >= self.stop:
            raise StopIteration
        
        #Se requiere retornar el valor antes de incrementarlo
        value = self.i
        self.i += self.step
        return value

In [47]:
list(ContadorIterador(start = 2.5, step = 0.5, stop = 5))

[2.5, 3.0, 3.5, 4.0, 4.5]

La distinción más importante entre el generador y el iterador, es que en vez de tener un simple objecto iterador, ahora tenemos una clase más desarrollada que actúa como un iterador, lo que significa que podemos extender sus capacidades más allá de los generadores regulares.

Una de las cuantas limitaciones de generadores regulares es que no se puede usar `len()` ni se puede usar slices.

In [57]:
import itertools

class IteradorAvanzado:
    
    def __init__(self, start = 0, step = 1, stop = None):
        self.i = start
        self.start = start
        self.step = step
        self.stop = stop
    
    
    def __iter__(self):
        return self
    
    
    def __next__(self):
        if self.stop is not None and self.i >= self.stop:
            raise StopIteration
            
        value = self.i
        self.i += self.step
        return value
    
    
    def __len__(self):
        return int((self.stop - self.start) // self.step)

    
    def __contains__(self, key):
        return self.start < key < self.stop
    
    
    def __repr__(self):
        return (
            f"{self.__class__.__name__}(start = {self.start}),"
            f"step = {self.step}, stop = {self.stop}"
        )
    
    
    def __getitem__(self, slice_):
        return itertools.islice(self, slice_.start, slice_.stop, slice_.step)

Ahora tenemos un iterador que soporta `len()`, `in` y `repr()`.

In [58]:
count = IteradorAvanzado(start=2.5, step=0.5, stop=5)

In [59]:
count

IteradorAvanzado(start = 2.5),step = 0.5, stop = 5

In [60]:
3 in count

True

In [61]:
1 in count

False

In [62]:
len(count)

5

In [63]:
count[:3]

<itertools.islice at 0x2a025d90630>

In [64]:
list(count[:3])

[2.5, 3.0, 3.5]