### Iterables and Generators

One nice thing about a list is that you can retrieve specific elements by their indices. But you don’t always need this! A list of a billion numbers takes up a lot of memory. If you only want the elements one at a time, there’s no good reason to keep them all around. If you only end up needing the first several elements, generating the entire billion is hugely wasteful.

Often all we need is to iterate over the collection using for and in. In this case we can create generators, which can be iterated over just like lists but generate their values lazily on demand.

One way to create generators is with functions and the yield operator:

In [1]:
def create_list(n):
    lista = []
    for i in range(n):
        lista.append(i)
    return lista

In [2]:
def generate_range(n):
    i = 0
    while i < n:
        yield i   # every call to yield produces a value of the generator
        i += 1

In [3]:
%%time
for i in create_list(100000):
    print(i, end="\r")

CPU times: user 6.23 s, sys: 1.61 s, total: 7.84 s
Wall time: 8.84 s


In [4]:
generate_range(n=100000)

<generator object generate_range at 0x1076528d0>

In [5]:
%%time
for i in generate_range(n=100000):
    print(i, end="\r")

CPU times: user 6.37 s, sys: 1.7 s, total: 8.07 s
Wall time: 8.97 s


In [6]:
generate_range(10)

<generator object generate_range at 0x107652150>

In [7]:
for i in generate_range(10):
    print(f"i: {i}")

i: 0
i: 1
i: 2
i: 3
i: 4
i: 5
i: 6
i: 7
i: 8
i: 9


In [8]:
x=2
print(f"X: {x}")

X: 2


In [9]:
def check_prime(number):    
    for divisor in range(2, int(number)//2 +10):
        if number % divisor == 0:
            return False
    return True

# Esto es un generador (tiene 'yield')
# Es decir, me va a ir devolviendo el siguiente número, como si fuera un loop, pero sin guardarlos todos en memoria
# Es un iterable        
def primes(n):    
    number = 1
    while number < n:        
        number += 1        
        if check_prime(number=number):    
            # El 'yield' hace que python sepa que es un generador       
            yield number

In [10]:
generator = primes(n=100)
generator

<generator object primes at 0x107652bd0>

In [11]:
# El generador es mucho más eficiente, porque solo guarda en memoria la función, y el último valor calculado (para poder calcular el siguiente), en vez de calcular todos y devolver la posición que queremos
type(generator)

generator

In [12]:
# Para sacar los siguientes valores del generador, usamos la función next()
for i in range(3):
    print(next(generator))

19
23
29


In [15]:
# Si ejecutamos esto varias veces, siempre nos va a dar el siguiente valor, de acuerdo al generador
print(next(generator))

41


In [None]:
# Al hacer lista el iterable, calculamos todos los valores (dentro del rango dado) y los guardamos
list(generator)

Conceptos del generador:

- El generador no calcula todos los n'umeros de la secuencia (que puede ser infinita)
- Cada vez que se llame al next, ejecutará 1 vez el 'yield' de la función
- Cuando transformas el generador a otro tipo, por ejemplo list, llama a next todas als veces posibles hasta terminar el bucle
-Es útil cuando tienes que calcular una secuencia muy larga de números que solo vas a necesitar de 1 en 1 (con el next)

In [17]:
# Al haber un return en la función, cada vez que llega al return, termina la función.
# Por eso, cuando usamos next sobre este generador, siempre retorna 0, porque cada vez que lo ejecutamos de nuevo, se ejecuta desde el principio
# Esto es MUY RARO y MALA PRAXIS
def generate_range_con_return(n):
    i = 0

    while i < n:
        yield i
        i += 1

    return 'FIN'

x = generate_range_con_return(10)
print(next(x))

0
