# Generadores
## Programación para Análisis de Datos
## Mtra. Gisel Hernández Chávez

### Contenido principal
+ Sintaxis de expresión generadora. Ejemplos y ejercicios
+ Función generadora para producir iteradores. Ejemplos y ejercicios.
+ Diferencia entre funciones generadoras y funciones que usan return 


## Revisión de ejercicio de expresión generadora de la tarea

In [21]:
# Ejercicio con expresión generadora en la tarea pasada
def llave_in(k,L,d):
    if all(True if k1 in i else False for i in [L,d]):
        print(f"La llave {k} del diccionario tiene el valor {d[k]}")
    else:
         print(f"La llave {k} no esta en el diccionario {d} ni en la lista {L}")
            
k1= 'a'
L1 = [1,2]
L2 = ['r','a']
d1 ={1:'a'} 
d2 = {1:1,2:2}

In [22]:
llave_in(k1,L1,d1)

La llave a no esta en el diccionario {1: 'a'} ni en la lista [1, 2]


## Ejercicio de expresión generadora

Escriba una expresión generadora que permita iterar sobre cada línea de la cadena line_list

In [23]:
line_list = ['  line 1\n', 'line 2  \n', 'line 3  \n']  # lista de cadenas

# La expresión generadora retorna un iterador
# Note que va encerrada entre paréntesis
stripped_iter = (line.strip() for line in line_list)  # se crea objeto de tipo generator
type(stripped_iter) # informa que es del tipo generator (un tipo de iterator)


generator

In [24]:
print(type(stripped_iter ))  

<class 'generator'>


In [25]:
for i in stripped_iter:
    print(i)



line 1
line 2
line 3


In [33]:
# La lista por comprensión retorna una lista
stripped_list = [line.strip() for line in line_list]
print(type(stripped_list )) 

<class 'list'>


## Generadores

Los generadores son una clase especial de funciones que simplifican la tarea de escribir iteradores. Las funciones regulares calculan un valor y lo devuelven, pero __los generadores devuelven un iterador que devuelve un flujo de valores__.

Sin duda, está familiarizado con cómo funcionan las llamadas a funciones regulares en Python. Ver https://es.wikipedia.org/wiki/Pila_de_llamadas 
+ Cuando llama a una función, obtiene un espacio de nombres privado donde se crean sus variables locales. 
+ Cuando la función alcanza una declaración de retorno, las variables locales se destruyen y el valor se devuelve al llamador.
+ Una llamada posterior a la misma función crea un nuevo espacio de nombres privado y un nuevo conjunto de variables locales.

Pero, ¿qué pasa si las variables locales no se descartan al salir de una función? ¿Qué pasaría si luego pudiera reanudar la función donde la dejó? Esto es lo que proporcionan los generadores; se pueden considerar como funciones reanudables.

+ Cualquier función que contenga una palabra clave yield es una función generadora.

+ Cuando llamas a una función de generador, no devuelve un solo valor; en su lugar, devuelve un objeto generador que admite el protocolo de iterador. 
+ Al ejecutar la expresión yield, el generador genera el valor de i, similar a una declaración return. La gran diferencia entre yield y return es que al alcanzar un rendimiento se suspende el estado de ejecución del generador y se conservan las variables locales. En la próxima llamada al método __next __ () del generador, la función continuará ejecutándose.

In [27]:
def generate_ints(N):
   for i in range(N):
       yield i

In [28]:
gen = generate_ints(3)
gen  

<generator object generate_ints at 0x0000018BD16CDC80>

In [29]:
next(gen)

0

In [30]:
next(gen)

1

In [31]:
next(gen)

2

In [32]:
next(gen)  # Levanta una excepción StopIteration porque se agotaron los valores

StopIteration: 

In [None]:
a, b, c = generate_ints(3)
print(a,b,c)

0 1 2


In [None]:
for i in generate_ints(3):
    print(i)

0
1
2


## Ejercicio. Encontrar los factores primos de un número

En teoría de números, los factores primos de un número entero __son los números primos divisores__ exactos de ese número entero.

a) Con una función regular

b) Con una función generadora

c) Con recursión

__Algoritmo_

1. Denote al número con n.
2. Inicialice el conjunto factores primos fp con conjunto vacío
3. while num is divisible por 2
    3.1 Adicione 2 al conjunto fp
    3.2 n = n // 2
+ # En este punto num es impar
4. from i = 3 hasta raíz cuadrada de n con paso 2
    while n divisible por i
        4.1 adicione i al conjunto fp
        4.2 n = n // i
    if n > 2  # caso en el que n es un número primo y mayor que 2 y n no puede ser 1
        4.3 Adicione n a fp
5. retorne fp

In [None]:
from math import ceil,sqrt

In [None]:
# Con una función regular
def primefactors(n):
    '''
    Parameters
    ----------
    n : int
        Número para determinarle sus factores primos

    Returns
    -------
    fp : set
        Factores primos del número
    '''
    #número par
    fp = set()  # conjunto de factores primos
    while n % 2 == 0:
        fp.add(2)
        n = n // 2
    # n se convierte en impar
    for i in range(3,int(sqrt(n))+1,2):
        while (n % i == 0):
            fp.add(i)
            n = n // i
    if n > 2:
        fp.add(n)
    return fp

In [None]:
fp = primefactors(15)
fp

{3, 5}

## Solución con función generadora

In [None]:
# Función generadora que encuentra los factores primos de un número  

def prime_factor(n):
    '''
        n: int
        genera los factores primos
    '''
    while n % 2 == 0:
        yield 2
        n = n // 2
    # n se convierte en impar
    for i in range(3,int(sqrt(n))+1,2):
        while (n % i == 0):
            yield i
            n = n // i
    if n > 2:
        yield n

In [None]:
prime_fact = set()
for i in prime_factor(50):
    prime_fact.add(i)

prime_fact


{2, 5}

## Solución con recursión y función generadora

Recordar que 

next(iterator[, default])

Returna el siguiente elemento del iterador. Si se pasa el argumento default y el iterador está exhausto, se retorna ese valor en lugar de levantar la excepción StopIteration.

### Leer datos de un generador usando yield from

Ejemplo tomado de https://stackoverflow.com/questions/9708902/in-practice-what-are-the-main-uses-for-the-yield-from-syntax-in-python-3-3

__Nota__: una función wrapper extiende el funcionamiento de otra función y tiene como parámetro la función a la cual extiende (envuelve). Más aelante veremos cómo se usa para definir decoradores.

In [None]:
def reader():
    """A generator that fakes a read from a file, socket, etc."""
    for i in range(4):
        yield '<< %s' % i

def reader_wrapper(g):
    # Manually iterate over data produced by reader
    for v in g:
        yield v

wrap = reader_wrapper(reader())
for i in wrap:
    print(i)

<< 0
<< 1
<< 2
<< 3


In [None]:
# usando yield from

def reader_wrapper2(g):
    yield from g

In [None]:
wrap = reader_wrapper2(reader())
for i in wrap:
    print(i)

<< 0
<< 1
<< 2
<< 3


In [34]:
from math import ceil,sqrt
def factorgen(n):
    '''Encuentra todos los factores primos'''
    if n <= 1: 
        return
    prime = next((x for x in range(2, ceil(sqrt(n))+1) if n%x == 0), n)
    yield prime
    yield from factorgen(n//prime) # recursión

In [35]:
fact_prim =set()    
for i in factorgen(17):
    fact_prim.add(i)
print(fact_prim)

{17}


## Ejercicios sobre generadores

1.__The Sieve of Eratosthenes__. We created a list or a set of candidate prime numbers. This exercise has three parts:
    + initialization, 
    + generating the list (or set) or prime numbers, 
    + then reporting. 
    
In the list version, we had to filter the sequence of boolean values to determine the primes. In the set version, the set contained the primes.
Within the Generate step, there is a point where we know that the value of p is prime. At this point, we can yield p. If yield each value as we discover it, we eliminate the entire "report" step from the function.

2. __The Generator Version of range__. The range function creates a sequence. For very large sequences, this consumes a lot of memory. You can write a version of range which does not create the entire sequence, but instead yields the individual values. Using a generator will have the same effect as iterating through a sequence, but won't consume as much memory.

Define a generator, genrange, which generates the same sequence of values as range, without creating a list object.
Check the documentation for the built-in function xrange.
